All Projects → turicas → Salarios Magistrados

turicas / Salarios Magistrados

Licence: lgpl-3.0
Baixa as planilhas de salários de magistrados, extrai os contracheques, limpa e exporta pra CSV

Programming Languages

python
139335 projects - #7 most used programming language

Projects that are alternatives of or similar to Salarios Magistrados

Socios Brasil
Captura os dados de sócios das empresas brasileiras na Receita Federal e exporta para um formato legível por humanos
Stars: ✭ 445 (+79.44%)
Mutual labels:  opendata, brazil, datascience
genero-nomes
Classifica nomes por gênero de acordo com API do IBGE
Stars: ✭ 33 (-86.69%)
Mutual labels:  brazil, opendata, datascience
blog.brasil.io
Blog do Brasil.IO
Stars: ✭ 24 (-90.32%)
Mutual labels:  brazil, opendata
municipios-br
Dados em formato aberto sobre municípios e unidades federativas do Brasil.
Stars: ✭ 58 (-76.61%)
Mutual labels:  brazil, opendata
Open-Data-Lab
an initiative to provide infrastructure for reproducible workflows around open data
Stars: ✭ 26 (-89.52%)
Mutual labels:  opendata, datascience
Brasil.io
Backend do Brasil.IO (para código dos scripts de coleta de dados, veja o link na página de cada dataset)
Stars: ✭ 780 (+214.52%)
Mutual labels:  opendata, brazil
Eleicoes Brasil
Scripts para capturar dados do Repositório de Dados Eleitorais do TSE, limpá-los, normalizá-los e agrupá-los
Stars: ✭ 85 (-65.73%)
Mutual labels:  opendata, brazil
Virgilio
Virgilio is developed and maintained by these awesome people. You can email us virgilio.datascience (at) gmail.com or join the Discord chat.
Stars: ✭ 13,200 (+5222.58%)
Mutual labels:  datascience
Tech.ml.dataset
A Clojure high performance data processing system
Stars: ✭ 205 (-17.34%)
Mutual labels:  datascience
Ocaml Jupyter
An OCaml kernel for Jupyter (IPython) notebook
Stars: ✭ 177 (-28.63%)
Mutual labels:  datascience
Data Science Resources
👨🏽‍🏫You can learn about what data science is and why it's important in today's modern world. Are you interested in data science?🔋
Stars: ✭ 171 (-31.05%)
Mutual labels:  datascience
Catalogos Dados Brasil
Mapeamento de iniciativas (e catálogos) de dados abertos governamentais no Brasil.
Stars: ✭ 187 (-24.6%)
Mutual labels:  brazil
Morpheus Core
The foundational library of the Morpheus data science framework
Stars: ✭ 203 (-18.15%)
Mutual labels:  datascience
Udata
Customizable and skinnable social platform dedicated to open data.
Stars: ✭ 181 (-27.02%)
Mutual labels:  opendata
My Awesome Ai Bookmarks
Curated list of my reads, implementations and core concepts of Artificial Intelligence, Deep Learning, Machine Learning by best folk in the world.
Stars: ✭ 223 (-10.08%)
Mutual labels:  datascience
100 Days Of Ml Code
A day to day plan for this challenge. Covers both theoritical and practical aspects
Stars: ✭ 172 (-30.65%)
Mutual labels:  datascience
Forum
Ama Laravel? Torne se um Jedi e Ajude outros Padawans
Stars: ✭ 233 (-6.05%)
Mutual labels:  brazil
Melusine
Melusine is a high-level library for emails classification and feature extraction "dédiée aux courriels français".
Stars: ✭ 222 (-10.48%)
Mutual labels:  datascience
Php Documents
Library to provide Brazilian Documents as Value Objects in PHP
Stars: ✭ 197 (-20.56%)
Mutual labels:  brazil
Climate Change Data
🌍 A curated list of APIs, open data and ML/AI projects on climate change
Stars: ✭ 195 (-21.37%)
Mutual labels:  datascience

Salários Magistrados - CNJ

Script que baixa todas as planilhas de salários de magistrados do site do CNJ, extrai a aba "Contracheque", faz algumas limpezas e exporta tudo para CSV.

Licença

A licença do código é LGPL3 e dos dados convertidos Creative Commons Attribution ShareAlike. Caso utilize os dados, cite a fonte original e quem tratou os dados, como: Fonte: Conselho Nacional de Justiça, dados tratados por Álvaro Justen/Brasil.IO. Caso compartilhe os dados, utilize a mesma licença.

Dados

Caso você não queira/possa rodar o script, acesse diretamente os dados convertidos no Brasil.IO.

Se esse programa e/ou os dados resultantes foram úteis a você ou à sua empresa, considere fazer uma doação ao projeto Brasil.IO, que é mantido voluntariamente.

Erros nos Dados

Nem todas as planilhas puderam ser convertidas. Verifique o arquivo erros.csv para entender quais erros existem nos dados originais e como isso se propaga para os dados gerados pelo script.

Encontrou algum erro na conversão que o script faz? Crie uma issue nesse repositório.

Rodando

Esse script depende de Python 3.7+ e de algumas bibliotecas. Instale-as executando:

pip install -r requirements.txt

Para rodar:

./run.sh

Esse script irá rodar dois scripts, um que baixa as planilhas e outro que as extrai e gera o resultado. Você pode rodá-los independentemente também:

# Baixa planilhas e gera `data/output/planilha.csv`:
scrapy runspider --loglevel=INFO -o data/output/planilha.csv download_files.py
gzip data/output/planilha.csv

# Lê `data/output/planilha.csv.gz` e gera outros arquivos em `data/output`:
python parse_files.py

Um diretório data será criado, onde:

  • data/download: planilhas baixadas;
  • data/output: arquivos de saída (CSVs compactados).
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].