All Projects → turicas → genero-nomes

turicas / genero-nomes

Licence: LGPL-3.0 license
Classifica nomes por gênero de acordo com API do IBGE

Programming Languages

python
139335 projects - #7 most used programming language
shell
77523 projects

Projects that are alternatives of or similar to genero-nomes

Salarios Magistrados
Baixa as planilhas de salários de magistrados, extrai os contracheques, limpa e exporta pra CSV
Stars: ✭ 248 (+651.52%)
Mutual labels:  brazil, opendata, datascience
Socios Brasil
Captura os dados de sócios das empresas brasileiras na Receita Federal e exporta para um formato legível por humanos
Stars: ✭ 445 (+1248.48%)
Mutual labels:  brazil, opendata, datascience
blog.brasil.io
Blog do Brasil.IO
Stars: ✭ 24 (-27.27%)
Mutual labels:  brazil, opendata
Open-Data-Lab
an initiative to provide infrastructure for reproducible workflows around open data
Stars: ✭ 26 (-21.21%)
Mutual labels:  opendata, datascience
Brasil.io
Backend do Brasil.IO (para código dos scripts de coleta de dados, veja o link na página de cada dataset)
Stars: ✭ 780 (+2263.64%)
Mutual labels:  brazil, opendata
Eleicoes Brasil
Scripts para capturar dados do Repositório de Dados Eleitorais do TSE, limpá-los, normalizá-los e agrupá-los
Stars: ✭ 85 (+157.58%)
Mutual labels:  brazil, opendata
municipios-br
Dados em formato aberto sobre municípios e unidades federativas do Brasil.
Stars: ✭ 58 (+75.76%)
Mutual labels:  brazil, opendata
Bike-Sharing-Demand-Kaggle
Top 5th percentile solution to the Kaggle knowledge problem - Bike Sharing Demand
Stars: ✭ 33 (+0%)
Mutual labels:  datascience
esaj
Scrapers for many e-SAJ systems
Stars: ✭ 35 (+6.06%)
Mutual labels:  brazil
city-codes
Brazilian city names and official codes, IBGE, LexML and others
Stars: ✭ 39 (+18.18%)
Mutual labels:  brazil
homebridge-airrohr
HomeBridge module for the DIY luftdaten.info particulates sensor. See http://luftdaten.info how to build your own
Stars: ✭ 48 (+45.45%)
Mutual labels:  opendata
covid19-br-info
Coronavirus frontend info about Brazil's states and cities
Stars: ✭ 12 (-63.64%)
Mutual labels:  brazil
transparencia-dados-abertos-brasil
A survey of Brazilian states' and municipalities' transparency and open data portals, as well as institutional websites, obtained from several public data sources. 🇧🇷 Levantamento de portais estaduais e municipais de transparência e dados abertos, bem como os portais institucionais, obtido a partir de diversas fontes públicas de dados.
Stars: ✭ 46 (+39.39%)
Mutual labels:  brazil
cada.data.gouv.fr
A simple interface to search and display CADA advices
Stars: ✭ 16 (-51.52%)
Mutual labels:  opendata
open-geoscience-repository
Open geoscience datasets available in open databases from Google Drive, SEG Wiki, and US DoE Geothermal Data Repository OpenEi
Stars: ✭ 83 (+151.52%)
Mutual labels:  opendata
snorkel
Snorkel - Bootstrap your Data Science
Stars: ✭ 24 (-27.27%)
Mutual labels:  datascience
dst
yet another custom data science template via cookiecutter
Stars: ✭ 59 (+78.79%)
Mutual labels:  datascience
vagas
Vagas e empresas que ativamente contratam pessoas desenvolvedoras Clojure no Brasil
Stars: ✭ 75 (+127.27%)
Mutual labels:  brazil
awesome-open-mlops
The Fuzzy Labs guide to the universe of open source MLOps
Stars: ✭ 304 (+821.21%)
Mutual labels:  datascience
machine learning from scratch matlab python
Vectorized Machine Learning in Python 🐍 From Scratch
Stars: ✭ 28 (-15.15%)
Mutual labels:  datascience

Gênero dos Nomes Brasileiros

Script que baixa dados de gênero do IBGE Nomes (Censo 2010) e cria um banco de dados, que pode ser utilizado para classificar nomes por gênero em bases que não possuem essa informação.

Licença

A licença do código é LGPL3 e dos dados convertidos Creative Commons Attribution ShareAlike. Caso utilize os dados, cite a fonte original e quem tratou os dados, como: Fonte: IBGE/Censo 2010, dados tratados por Álvaro Justen/Brasil.IO. Caso compartilhe os dados, utilize a mesma licença.

Dados

Caso você não queira/possa rodar o script, acesse diretamente os dados convertidos no Brasil.IO.

Se esse programa e/ou os dados resultantes foram úteis a você ou à sua empresa, considere fazer uma doação ao projeto Brasil.IO, que é mantido voluntariamente.

Rodando

Instalando as Dependências

Esse script depende de Python 3.7 e de algumas bibliotecas. Depois de instalar o Python 3.7 instale as bibliotecas executando:

pip install -r requirements.txt

Executando

Como o IBGE não divulga um índice de todos os nomes, é necessário que você possua um arquivo que tenha uma lista de nomes para que o script possa fazer a consulta. Por padrão o script utiliza como base um arquivo chamado data/input/documentos-brasil.csv.xz, que deve possuir uma coluna name com o nome e uma coluna document-type com o valor CPF (o dataset documentos-brasil do Brasil.IO possui esses dados).

Depois de conseguir esse arquivo, execute o script:

./run.sh
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].