All Projects → fabiogjardim → Bigdata_docker

fabiogjardim / Bigdata_docker

Big Data Ecosystem Docker

Programming Languages

vba
158 projects

Projects that are alternatives of or similar to Bigdata docker

Repository
个人学习知识库涉及到数据仓库建模、实时计算、大数据、Java、算法等。
Stars: ✭ 92 (-42.86%)
Mutual labels:  zookeeper, spark, hadoop, hive, hbase, hdfs
Szt Bigdata
深圳地铁大数据客流分析系统🚇🚄🌟
Stars: ✭ 826 (+413.04%)
Mutual labels:  zookeeper, spark, hadoop, hive, mysql, hbase
Bigdata Notes
大数据入门指南 ⭐
Stars: ✭ 10,991 (+6726.71%)
Mutual labels:  zookeeper, spark, hadoop, hive, hbase, hdfs
Bigdata
💎🔥大数据学习笔记
Stars: ✭ 488 (+203.11%)
Mutual labels:  zookeeper, hadoop, hive, mysql, hbase, hdfs
God Of Bigdata
专注大数据学习面试,大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...
Stars: ✭ 6,008 (+3631.68%)
Mutual labels:  zookeeper, spark, hadoop, hive, hbase, hdfs
Haproxy Configs
80+ HAProxy Configs for Hadoop, Big Data, NoSQL, Docker, Elasticsearch, SolrCloud, HBase, MySQL, PostgreSQL, Apache Drill, Hive, Presto, Impala, Hue, ZooKeeper, SSH, RabbitMQ, Redis, Riak, Cloudera, OpenTSDB, InfluxDB, Prometheus, Kibana, Graphite, Rancher etc.
Stars: ✭ 106 (-34.16%)
Mutual labels:  zookeeper, hadoop, hive, presto, mysql, hbase
Dockerfiles
50+ DockerHub public images for Docker & Kubernetes - Hadoop, Kafka, ZooKeeper, HBase, Cassandra, Solr, SolrCloud, Presto, Apache Drill, Nifi, Spark, Consul, Riak, TeamCity and DevOps tools built on the major Linux distros: Alpine, CentOS, Debian, Fedora, Ubuntu
Stars: ✭ 847 (+426.09%)
Mutual labels:  zookeeper, spark, hadoop, presto, hbase
Bigdataguide
大数据学习,从零开始学习大数据,包含大数据学习各阶段学习视频、面试资料
Stars: ✭ 817 (+407.45%)
Mutual labels:  zookeeper, spark, hadoop, hive, hbase
dockerfiles
Multi docker container images for main Big Data Tools. (Hadoop, Spark, Kafka, HBase, Cassandra, Zookeeper, Zeppelin, Drill, Flink, Hive, Hue, Mesos, ... )
Stars: ✭ 29 (-81.99%)
Mutual labels:  hive, hadoop, hbase, zookeeper, hue
aaocp
一个对用户行为日志进行分析的大数据项目
Stars: ✭ 53 (-67.08%)
Mutual labels:  hive, hadoop, hbase, zookeeper, hdfs
bigdata-fun
A complete (distributed) BigData stack, running in containers
Stars: ✭ 14 (-91.3%)
Mutual labels:  spark, hadoop, hbase, hdfs, hue
cloud
云计算之hadoop、hive、hue、oozie、sqoop、hbase、zookeeper环境搭建及配置文件
Stars: ✭ 48 (-70.19%)
Mutual labels:  hive, hadoop, hbase, zookeeper, hue
Hadoop cookbook
Cookbook to install Hadoop 2.0+ using Chef
Stars: ✭ 82 (-49.07%)
Mutual labels:  zookeeper, spark, hadoop, hive, hbase
Wedatasphere
WeDataSphere is a financial level one-stop open-source suitcase for big data platforms. Currently the source code of Scriptis and Linkis has already been released to the open-source community. WeDataSphere, Big Data Made Easy!
Stars: ✭ 372 (+131.06%)
Mutual labels:  spark, hadoop, hive, hbase
BigData-News
基于Spark2.2新闻网大数据实时系统项目
Stars: ✭ 36 (-77.64%)
Mutual labels:  spark, hive, hadoop, hbase
Devops Python Tools
80+ DevOps & Data CLI Tools - AWS, GCP, GCF Python Cloud Function, Log Anonymizer, Spark, Hadoop, HBase, Hive, Impala, Linux, Docker, Spark Data Converters & Validators (Avro/Parquet/JSON/CSV/INI/XML/YAML), Travis CI, AWS CloudFormation, Elasticsearch, Solr etc.
Stars: ✭ 406 (+152.17%)
Mutual labels:  spark, hadoop, hbase, hdfs
Spark With Python
Fundamentals of Spark with Python (using PySpark), code examples
Stars: ✭ 150 (-6.83%)
Mutual labels:  jupyter-notebook, spark, hadoop, hdfs
Nagios Plugins
450+ AWS, Hadoop, Cloud, Kafka, Docker, Elasticsearch, RabbitMQ, Redis, HBase, Solr, Cassandra, ZooKeeper, HDFS, Yarn, Hive, Presto, Drill, Impala, Consul, Spark, Jenkins, Travis CI, Git, MySQL, Linux, DNS, Whois, SSL Certs, Yum Security Updates, Kubernetes, Cloudera etc...
Stars: ✭ 1,000 (+521.12%)
Mutual labels:  zookeeper, hadoop, mysql, hbase
Learning Spark
零基础学习spark,大数据学习
Stars: ✭ 37 (-77.02%)
Mutual labels:  spark, hadoop, hbase, hdfs
Dataspherestudio
DataSphereStudio is a one stop data application development& management portal, covering scenarios including data exchange, desensitization/cleansing, analysis/mining, quality measurement, visualization, and task scheduling.
Stars: ✭ 1,195 (+642.24%)
Mutual labels:  spark, hadoop, hive, hue

BIG DATA ECOSYSTEM COM DOCKER

Ambiente para estudo dos principais frameworks big data em docker.
Esse setup vai criar dockers com os frameworks HDFS, HBase, Hive, Presto, Spark, Jupyter, Hue, Mongodb, Metabase, Nifi, kafka, Mysql e Zookeeper com a seguinte arquitetura:

Ecossistema

SOFTWARES NECESSÁRIOS

Para a criação e uso do ambiente vamos utilizar git e docker

OBS: Existe um git na instação do Docker ToolBox, caso já tenha instalado não precisa instalar novamente

SETUP

OBS: Esse passo deve ser realizado apena uma vez. Após o ambiente criado, utilizar o docker-compose para iniciar os containers como mostrado no tópico INICIANDO O AMBIENTE

Criação do diretório docker:

OBS: A criação do diretório é importante para os mapeamentos necessários

  • No Windows:

    • Criar na raiz do seu drive o diretório docker ex: C:\docker
  • No Linux:

    • Criar o diretório na home do usuário ex: /home/user/docker

Em um terminal/DOS, dentro diretório docker, realizar o clone do projeto no github

      git clone https://github.com/fabiogjardim/bigdata_docker.git

No diretório bigdata_docker vai existir os seguintes objetos

ls

  • No Windows:

    Abrir o Docker Quickstart Terminal, isso fará com que a VM default seja criada no VirtualBox ls

    No DOS, dentro do diretório bigdata_docker, renomear o arquivo docker-compose_windows.yml para docker-compose.yml

      move docker-compose_windows.yml docker-compose.yml
    

    Executar o arquivo virtualbox_config.bat
    O arquivo bat cria/reacria a VM default com disco de até 100GB, 8GB de memória, drive do repo compartilhado como /d e todas as portas necessárias mapeadas
    OBS: se o ser driver raiz for diferente de C:, alterar o arquivo virutalbox_config.bat na parte indicada no comentário. A memória também pode ser alterada no local indicado.
    ls

  • No Linux: Não é necessário alterar nem executar nada

INICIANDO O AMBIENTE

No Windows abrir o Docker Quickstart Terminal, do Linux um terminal

No terminal, no diretorio bigdata_docker, executar o docker-compose

      docker-compose up -d        

Verificar imagens e containers

     docker image ls

docker image ls

     docker container ls

docker container

SOLUCIONANDO PROBLEMAS

No Windows abrir o Docker Quickstart Terminal

Parar um containers

     docker stop [nome do container]      

Parar todos containers

     docker stop $(docker ps -a -q)

Remover um container

     docker rm [nome do container]

Remover todos containers

     docker rm $(docker ps -a -q)         

Dados do containers

     docker container inspect [nome do container]

Iniciar um container

     docker-compose up -d [nome do container]

Iniciar todos os containers

     docker-compose up -d 

Acessar log do container

     docker container logs [nome do container] 

Acesso WebUI dos Frameworks

Acesso por shell

HDFS
      docker exec -it datanode bash
HBase
      docker exec -it hbase-master bash
Sqoop
      docker exec -it datanode bash
Kafka
      docker exec -it kafka bash

Acesso JDBC

MySQL
      jdbc:mysql://database/employees
Hive
      jdbc:hive2://hive-server:10000/default
Presto
      jdbc:presto://presto:8080/hive/default

Usuários e senhas

Hue
Usuário: admin
Senha: admin
Metabase
Usuário: [email protected]
Senha: bigdata123 
MySQL
Usuário: root
Senha: secret
MongoDB
Usuário: root
Senha: root
Authentication Database: admin

Imagens

Docker Hub

Documentação Oficial

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].