All Projects → rictom → cnpj-sqlite

rictom / cnpj-sqlite

Licence: MIT license
Script em python para carregar os arquivos de cnpj com dados públicos da Receita Federal para o formato sqlite

Programming Languages

python
139335 projects - #7 most used programming language

Projects that are alternatives of or similar to cnpj-sqlite

rede-cnpj
Visualização gráfica de relacionamentos entre sócios e empresas com dados públicos de CNPJ.
Stars: ✭ 40 (-33.33%)
Mutual labels:  cnpj, receita-federal, dados-abertos
analises
Análises dos dados relacionados a Feira de Santana 📊
Stars: ✭ 31 (-48.33%)
Mutual labels:  dados-abertos
Atlas-Analytics
Repositório de dados e análises do Atlas da Notícia
Stars: ✭ 23 (-61.67%)
Mutual labels:  dados-abertos
ACBr.Net.Consulta
Biblioteca para consulta de CNPJ e CPF na Receita Federal e para consulta de dados do IBGE, CEP e Sintegra
Stars: ✭ 22 (-63.33%)
Mutual labels:  receita-federal
congresso em chamas
Congresso em chamas é uma aplicação web que entrega ferramentas para o acompanhamento do trabalho dos deputados federais atualmente em mandato.
Stars: ✭ 20 (-66.67%)
Mutual labels:  dados-abertos
burocracia.cr
No dependency Crystal shard to validate, generate and format Brazilian burocracias such as CPF, CNPJ and CEP
Stars: ✭ 21 (-65%)
Mutual labels:  cnpj
ocorrencias-transito-pmsp
Dados abertos sobre ocorrências de trânsito na cidade de São Paulo
Stars: ✭ 13 (-78.33%)
Mutual labels:  dados-abertos
insomnia-plugin-documents-br
O plugin tem a finalidade de gerar documentos e alguns dados mais usados, o foco é para dados do Brasil.
Stars: ✭ 21 (-65%)
Mutual labels:  cnpj
api sof
Tutorial para acessar a API do Sistema de Orçamento e Finanças _SOF da cidade de São Paulo, utilizando Python e a biblioteca Pandas, realizar análises e salvar arquivo CSV/Excel
Stars: ✭ 31 (-48.33%)
Mutual labels:  dados-abertos
irpf-cei
Programa auxiliar gratuito para calcular custos de ações, ETFs e fundos imobiliários.
Stars: ✭ 30 (-50%)
Mutual labels:  receita-federal
docker-irpf
Docker para IRPF (programa da Receita Federal para declaração de imposto de renda).
Stars: ✭ 28 (-53.33%)
Mutual labels:  receita-federal
ribge
R package for (down)loading data from IBGE (Instituto Brasileiro de Geografia e Estatística)
Stars: ✭ 44 (-26.67%)
Mutual labels:  dados-abertos
cnpj
🇧🇷 Format, validate and generate CNPJ numbers in Node & Deno
Stars: ✭ 26 (-56.67%)
Mutual labels:  cnpj
transparencia-dados-abertos-brasil
A survey of Brazilian states' and municipalities' transparency and open data portals, as well as institutional websites, obtained from several public data sources. 🇧🇷 Levantamento de portais estaduais e municipais de transparência e dados abertos, bem como os portais institucionais, obtido a partir de diversas fontes públicas de dados.
Stars: ✭ 46 (-23.33%)
Mutual labels:  dados-abertos
Brasil
.NET DevPack BR é uma coleção de utilidades como classes de documentos nacionais (CPF, CNPJ) com validação e classes de utilidade em geral. Desenvolvido para ser utilizado junto com o NetDevPack
Stars: ✭ 64 (+6.67%)
Mutual labels:  cnpj
aplicativos-dados-brasil
Mapeamento de aplicativos e visualizações que usam dados abertos governamentais no Brasil.
Stars: ✭ 58 (-3.33%)
Mutual labels:  dados-abertos
flunt.br
Extensions of Flunt for Brazilian projects
Stars: ✭ 42 (-30%)
Mutual labels:  cnpj
cnpj
🇧🇷 Validate, generate and format CNPJ numbers
Stars: ✭ 78 (+30%)
Mutual labels:  cnpj
Ro-dou
Gerador de DAGs no Airflow para fazer clipping do Diário Oficial da União.
Stars: ✭ 41 (-31.67%)
Mutual labels:  dados-abertos
api
Site que publica as informações libertadas pelo DadosJusBR
Stars: ✭ 31 (-48.33%)
Mutual labels:  dados-abertos

CNPJ-SQLITE

Script em python para converter os arquivos de dados públicos de CNPJs para o formato SQLITE. O código é compatível com o layout das tabelas disponibilizadas pela Receita Federal a partir de 2021.

Dados públicos de CNPJs no site da Receita:

Os arquivos csv zipados com os dados de CNPJs estão disponíveis em https://dados.gov.br/dados/conjuntos-dados/cadastro-nacional-da-pessoa-juridica-cnpj ou https://dadosabertos.rfb.gov.br/CNPJ/ (http://200.152.38.155/CNPJ/).

Pré-requisitos:

Python 3.8 ou posterior;
Bibliotecas pandas, dask e sqlalchemy.
55GB de disco livre, 30GB para a base em sqlite e 25GB para os arquivos do site da Receita zip ou descompactados. Os 25GB poderão ser liberados depois de rodar o script.

Utilizando o script:

Este projeto não baixa os arquivos do site da Receita. Obtenha uma relação dos arquivos disponíveis pelo comando
python dados_cnpj_lista_url.py

Baixe todos os arquivos zipados do site da Receita e salve na pasta "dados-publicos-zip".
O download no site da Receita é lento, pode demorar várias horas (a última vez levou 8 horas)
Sugiro utilizar um gerenciador de downloads, como o https://portableapps.com/apps/internet/free-download-manager-portable.

Crie uma pasta com o nome "dados-publicos".

Para iniciar a conversão dos arquivos para o formato sqlite, digite em um console:
python dados_cnpj_para_sqlite.py

O processamento leva cerca de 2hs em um notebook i7 de oitava geração.

Ao final, será gerado um arquivo cnpj.db, no formato sqlite, com cerca de 30GB, que poderá ser aberto no DB Browser for SQLITE (https://sqlitebrowser.org/).

O arquivo cnpj.db poderá ser usado no meu projeto rede-cnpj (https://github.com/rictom/rede-cnpj), que permite visualização gráfica de relacionamentos entre empresas e sócios. Este projeto está rodando online em https://www.redecnpj.com.br.
O projeto https://github.com/rictom/cnpj_consulta também utiliza o arquivo cnpj.db para visualizar os dados de cnpj em formato de tabela.

Arquivo sqlite já tratado com a base CNPJ:

O banco de dados no formato sqlite, referência 17/12/2022 ("miolo" .D21217.), está disponível em https://www.mediafire.com/folder/1vdqoa2mk0fu9/cnpj-sqlite. Baixe o arquivo cnpj.db.AAAA-MM-DD.7z (ou tar) e utilize o 7-zip (https://www.7-zip.org/download.html) para descompactar.

image
Lista das tabelas do arquivo cnpj.db no DBBrowser for SQLITE.

Conversão para mysql:

O script em https://github.com/rictom/cnpj-mysql faz o carregamento dos dados para o banco de dados em MYSQL.

Histórico de versões

versão 0.4 (setembro/2022)

  • inclusão de índice na coluna "nome fantasia" da tabela estabelecimento.

versão 0.3 (maio/2022)

  • inclusão de índice na coluna representante_legal da tabela sócios.

versão 0.2 (janeiro/2022)

  • removido código não utilizado

versão 0.1 (julho/2021)

  • primeira versão
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].