All Categories → Data Processing → flink

Top 106 flink open source projects

flink-parameter-server

Parameter Server implementation in Apache Flink

✭ 51

scala Jupyter Notebook shell recsys flink online-learning flink-ml

flink-crawler

Continuous scalable web crawler built on top of Flink and crawler-commons

✭ 48

java crawler spider web-crawler crawling flink web-crawling

mriya

Real-time ETL developed by Flink, data from MySQL to Greenplum. Use canal to parse the MySQL binlog, put it into kafka, use Flink to consume kafka and assemble the data into Greenplum, and more data sources and target sources will be added in the future.

✭ 65

java greenplum flink

np-flink

flink详细学习实践

✭ 26

java phoenix kafka clickhouse hbase flink

FlinkForward201709

Flink Forward 201709

✭ 43

flink

flink-prometheus-example

Example setup to demonstrate Prometheus integration of Apache Flink

✭ 69

java kotlin Dockerfile prometheus flink

flink-k8s-operator

An example of building kubernetes operator (Flink) using Abstract operator's framework

✭ 28

scala shell Dockerfile kubernetes operator flink

fastdata-cluster

Fast Data Cluster (Apache Cassandra, Kafka, Spark, Flink, YARN and HDFS with Vagrant and VirtualBox)

✭ 20

HTML shell vagrant kafka spark cassandra yarn hadoop cluster vms hdfs flink

litemall-dw

基于开源Litemall电商项目的大数据项目，包含前端埋点(openresty+lua)、后端埋点；数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化)，同时也包含了Azkaban的workflow。

✭ 36

java javascript Vue scala SCSS CSS redis vagrant kafka spring-boot hive solr clickhouse hbase spark-streaming openresty flume oozie flink azkaban spark-sql maxwell cdh6

LarkMidTable

LarkMidTable 是一站式开源的数据中台，实现中台的基础建设，数据治理，数据开发，监控告警，数据服务，数据的可视化，实现高效赋能数据前台并提供数据服务的产品。

✭ 873

java shell flink datax flink-sql flinkx flink-cdc seatunnel

2018-flink-forward-china

Flink Forward China 2018 第一届记录，视频记录 | 文档记录 | 不仅仅是流计算 | More than streaming

✭ 25

china flink

df data service

DataFibers Data Service

✭ 31

java javascript CSS HTML mongo streaming kafka hadoop vertx flink

fb scraper

FBLYZE is a Facebook scraping system and analysis system.

✭ 61

Jupyter Notebook python kafka spark tf-idf flink extract-data facebook-scraper

FlinkTutorial

FlinkTutorial 专注大数据Flink流试处理技术。从基础入门、概念、原理、实战、性能调优、源码解析等内容，使用Java开发，同时含有Scala部分核心代码。欢迎关注我的博客及github。

✭ 46

java scala kafka checkpoint flink

review-notes

团队分享学习、复盘笔记资料共享。Java、Scala、Flink...

✭ 27

javascript stylus shell jvm flink

piglet

A compiler for Pig Latin to Spark and Flink.

✭ 23

scala PigLatin spark pig flink pig-latin pig-compiler

cassandra.realtime

Different ways to process data into Cassandra in realtime with technologies such as Kafka, Spark, Akka, Flink

✭ 25

scala python java shell Dockerfile kafka akka spark cassandra spark-streaming kafka-connect flink flink-stream-processing flink-streaming

emma

A quotation-based Scala DSL for scalable data analysis.

✭ 61

scala java CSS javascript HTML shell python spark quotations flink emma scala-dsl scalable-data-analysis

Real-time-Data-Warehouse

Real-time Data Warehouse with Apache Flink & Apache Kafka & Apache Hudi

flink-connectors

Apache Flink connectors for Pravega.

✭ 84

java python stream-processing flink pravega

flink-training-troubleshooting

No description or website provided.

✭ 41

java flink

flink-learn

Learning Flink : Flink CEP,Flink Core,Flink SQL

✭ 70

java scala FreeMarker shell sql stream bigdata flink

hadoopoffice

HadoopOffice - Analyze Office documents using the Hadoop ecosystem (Spark/Flink/Hive)

✭ 56

java scala shell spark hive hadoop excel bigdata office poi flink hadoop-ecosystem hadoopoffice analyze-office-documents

coolplayflink

Flink: Stateful Computations over Data Streams

✭ 14

streaming bigdata realtime flink

Archived-SANSA-Query

SANSA Query Layer

✭ 31

scala java shell spark sparql rdf distributed-computing partitioning flink

flink-demo

Flink Demo

✭ 39

java flink flink-examples flink-sql

flink-streaming-source-analysis

flink 流处理源码分析

✭ 47

java scala flink flink-stream-processing source-analysis

dockerfiles

Multi docker container images for main Big Data Tools. (Hadoop, Spark, Kafka, HBase, Cassandra, Zookeeper, Zeppelin, Drill, Flink, Hive, Hue, Mesos, ... )

✭ 29

shell Dockerfile python Makefile Batchfile XSLT javascript dockerfile kafka spark cassandra hive hadoop docker-image bigdata hbase zookeeper mesos hue flink zeppelin drill

Websockets-Vertx-Flink-Kafka

A simple request response cycle using Websockets, Eclipse Vert-x server, Apache Kafka, Apache Flink.

✭ 14

java kafka websocket eventbus vertx flink flink-kafka vertx-eventbus vertx-kafka flink-kafka-consumer

apache-flink-jdbc-streaming

Sample project for Apache Flink with Streaming Engine and JDBC Sink

✭ 22

java Protocol Buffer mysql protobuf jdbc apache apache-flink flink flink-stream-processing

seatunnel-example

seatunnel plugin developing examples.

✭ 27

scala java spark spark-streaming flink sql-engine etl-framework waterdrop etl-pipeline

open-stream-processing-benchmark

This repository contains the code base for the Open Stream Processing Benchmark.

✭ 37

Jupyter Notebook scala shell Dockerfile distributed-systems benchmark real-time kafka spark distributed-computing stream-processing spark-streaming flink kafka-streams benchmark-suite real-time-processing structured-streaming

logparser

Easy parsing of Apache HTTPD and NGINX access logs with Java, Hadoop, Hive, Pig, Flink, Beam, Storm, Drill, ...

✭ 139

java perl shell nginx parser parse hive beam httpd pig flink drill logformat

dlink

Dinky is an out of the box one-stop real-time computing platform dedicated to the construction and practice of Unified Streaming & Batch and Unified Data Lake & Data Warehouse. Based on Apache Flink, Dinky provides the ability to connect many big data frameworks including OLAP and Data Lake.

✭ 1,535