All Projects → incubator-linkis → Similar Projects or Alternatives

1499 Open source projects that are alternatives of or similar to incubator-linkis

Linkis helps easily connect to various back-end computation/storage engines(Spark, Python, TiDB...), exposes various interfaces(REST, JDBC, Java ...), with multi-tenancy, high performance, and resource control.

Stars: ✭ 2,323 (-5.53%)

Mutual labels: spark, presto, hive, storage, jdbc, engine, impala, pyspark, udf, thrift-server, resource-manager, jobserver, application-manager, livy, hive-table, linkis, context-service, scriptis

Yanagishima

Web UI for Trino, Presto, Hive, Elasticsearch, SparkSQL

Stars: ✭ 424 (-82.76%)

Mutual labels: spark, presto, hive

Trino

Official repository of Trino, the distributed SQL query engine for big data, formerly known as PrestoSQL (https://trino.io)

Stars: ✭ 4,581 (+86.3%)

Mutual labels: presto, hive, jdbc

Sqli

orm sql interface, Criteria, CriteriaBuilder, ResultMapBuilder

Stars: ✭ 1,644 (-33.14%)

Mutual labels: presto, jdbc, impala

Cube.js

📊 Cube — Open-Source Analytics API for Building Data Apps

Stars: ✭ 11,983 (+387.31%)

Mutual labels: spark, presto, hive

Bigdata docker

Big Data Ecosystem Docker

Stars: ✭ 161 (-93.45%)

Mutual labels: spark, presto, hive

Gimel

Big Data Processing Framework - Unified Data API or SQL on Any Storage

Stars: ✭ 216 (-91.22%)

Mutual labels: spark, jdbc, pyspark

hadoop-data-ingestion-tool

OLAP and ETL of Big Data

Stars: ✭ 17 (-99.31%)

Mutual labels: presto, engine, impala

Kyuubi

Kyuubi is a unified multi-tenant JDBC interface for large-scale data processing and analytics, built on top of Apache Spark

Stars: ✭ 363 (-85.24%)

Mutual labels: spark, hive, jdbc

Scriptis

Scriptis is for interactive data analysis with script development(SQL, Pyspark, HiveQL), task submission(Spark, Hive), UDF, function, resource management and intelligent diagnosis.

Stars: ✭ 696 (-71.7%)

Mutual labels: spark, hive, pyspark

BigData-News

基于Spark2.2新闻网大数据实时系统项目

Stars: ✭ 36 (-98.54%)

Mutual labels: spark, hive

Pysparkgeoanalysis

🌐 Interactive Workshop on GeoAnalysis using PySpark

Stars: ✭ 63 (-97.44%)

Mutual labels: spark, pyspark

W2v

Word2Vec models with Twitter data using Spark. Blog:

Stars: ✭ 64 (-97.4%)

Mutual labels: spark, pyspark

Apache Spark Hands On

Educational notes,Hands on problems w/ solutions for hadoop ecosystem

Stars: ✭ 74 (-96.99%)

Mutual labels: spark, hive

Hadoop cookbook

Cookbook to install Hadoop 2.0+ using Chef

Stars: ✭ 82 (-96.67%)

Mutual labels: spark, hive

Hops Examples

Examples for Deep Learning/Feature Store/Spark/Flink/Hive/Kafka jobs and Jupyter notebooks on Hops

Stars: ✭ 84 (-96.58%)

Mutual labels: spark, hive

Repository

个人学习知识库涉及到数据仓库建模、实时计算、大数据、Java、算法等。

Stars: ✭ 92 (-96.26%)

Mutual labels: spark, hive

Hnswlib

Java library for approximate nearest neighbors search using Hierarchical Navigable Small World graphs

Stars: ✭ 108 (-95.61%)

Mutual labels: spark, pyspark

Pyspark Cheatsheet

🐍 Quick reference guide to common patterns & functions in PySpark.

Stars: ✭ 108 (-95.61%)

Mutual labels: spark, pyspark

Eat pyspark in 10 days

pyspark🍒🥭 is delicious，just eat it!😋😋

Stars: ✭ 116 (-95.28%)

Mutual labels: spark, pyspark

Pyspark Learning

Updated repository

Stars: ✭ 147 (-94.02%)

Mutual labels: spark, pyspark

Spark Py Notebooks

Apache Spark & Python (pySpark) tutorials for Big Data Analysis and Machine Learning as IPython / Jupyter notebooks

Stars: ✭ 1,338 (-45.59%)

Mutual labels: spark, pyspark

Hadoopcryptoledger

Hadoop Crypto Ledger - Analyzing CryptoLedgers, such as Bitcoin Blockchain, on Big Data platforms, such as Hadoop/Spark/Flink/Hive

Stars: ✭ 126 (-94.88%)

Mutual labels: spark, hive

Cc Pyspark

Process Common Crawl data with Python and Spark

Stars: ✭ 147 (-94.02%)

Mutual labels: spark, pyspark

Quill

Compile-time Language Integrated Queries for Scala

Stars: ✭ 1,998 (-18.75%)

Mutual labels: spark, jdbc

Spark Iforest

Isolation Forest on Spark

Stars: ✭ 166 (-93.25%)

Mutual labels: spark, pyspark

Optimus

🚚 Agile Data Preparation Workflows made easy with dask, cudf, dask_cudf and pyspark

Stars: ✭ 986 (-59.9%)

Mutual labels: spark, pyspark

Sparkmagic

Jupyter magics and kernels for working with remote Spark clusters

Stars: ✭ 954 (-61.2%)

Mutual labels: spark, pyspark

Luigi Warehouse

A luigi powered analytics / warehouse stack

Stars: ✭ 72 (-97.07%)

Mutual labels: spark, hive

Spark

Apache Spark - A unified analytics engine for large-scale data processing

Stars: ✭ 31,618 (+1185.81%)

Mutual labels: spark, jdbc

Spark Website

Apache Spark Website

Stars: ✭ 75 (-96.95%)

Mutual labels: spark, jdbc

Dataspherestudio

DataSphereStudio is a one stop data application development& management portal, covering scenarios including data exchange, desensitization/cleansing, analysis/mining, quality measurement, visualization, and task scheduling.

Stars: ✭ 1,195 (-51.4%)

Mutual labels: spark, hive

Spark python ml examples

Spark 2.0 Python Machine Learning examples

Stars: ✭ 87 (-96.46%)

Mutual labels: spark, pyspark

Live log analyzer spark

Spark Application for analysis of Apache Access logs and detect anamolies! Along with Medium Article.

Stars: ✭ 14 (-99.43%)

Mutual labels: spark, pyspark

Splash

Splash, a flexible Spark shuffle manager that supports user-defined storage backends for shuffle data storage and exchange

Stars: ✭ 105 (-95.73%)

Mutual labels: spark, storage

Bigdata Notes

大数据入门指南 ⭐

Stars: ✭ 10,991 (+346.97%)

Mutual labels: spark, hive

Spark Nlp

State of the Art Natural Language Processing

Stars: ✭ 2,518 (+2.4%)

Mutual labels: spark, pyspark

spark-acid

ACID Data Source for Apache Spark based on Hive ACID

Stars: ✭ 91 (-96.3%)

Mutual labels: spark, hive

Relation extraction

Relation Extraction using Deep learning(CNN)

Stars: ✭ 96 (-96.1%)

Mutual labels: spark, pyspark

Spark Authorizer

A Spark SQL extension which provides SQL Standard Authorization for Apache Spark

Stars: ✭ 141 (-94.27%)

Mutual labels: spark, hive

Quicksql

A Flexible, Fast, Federated(3F) SQL Analysis Middleware for Multiple Data Sources

Stars: ✭ 1,821 (-25.95%)

Mutual labels: spark, hive

Spark With Python

Fundamentals of Spark with Python (using PySpark), code examples

Stars: ✭ 150 (-93.9%)

Mutual labels: spark, pyspark

Sparkling Titanic

Training models with Apache Spark, PySpark for Titanic Kaggle competition

Stars: ✭ 12 (-99.51%)

Mutual labels: spark, pyspark

Azure Cosmosdb Spark

Apache Spark Connector for Azure Cosmos DB

Stars: ✭ 165 (-93.29%)

Mutual labels: spark, pyspark

kafka-compose

🎼 Docker compose files for various kafka stacks

Stars: ✭ 32 (-98.7%)

Mutual labels: spark, pyspark

Addax

Addax is an open source universal ETL tool that supports most of those RDBMS and NoSQLs on the planet, helping you transfer data from any one place to another.

Stars: ✭ 615 (-74.99%)

Mutual labels: hive, impala

Xsql

Unified SQL Analytics Engine Based on SparkSQL

Stars: ✭ 176 (-92.84%)

Mutual labels: spark, hive

Mmlspark

Simple and Distributed Machine Learning

Stars: ✭ 2,899 (+17.89%)

Mutual labels: spark, pyspark

Hadoop Docker

基于Docker构建的Hadoop开发测试环境，包含Hadoop，Hive，HBase，Spark