All Projects → ucd-dnp → leila

ucd-dnp / leila

Licence: other
Librería para la evaluación de calidad de datos, e interacción con el portal de datos.gov.co

Programming Languages

Jupyter Notebook
11667 projects
python
139335 projects - #7 most used programming language
HTML
75241 projects

Projects that are alternatives of or similar to leila

Pandas Profiling
Create HTML profiling reports from pandas DataFrame objects
Stars: ✭ 8,329 (+14773.21%)
Mutual labels:  exploratory-data-analysis, eda, data-quality
Great expectations
Always know what to expect from your data.
Stars: ✭ 5,808 (+10271.43%)
Mutual labels:  exploratory-data-analysis, eda, data-quality
Autoeda Resources
A list of software and papers related to automatic and fast Exploratory Data Analysis
Stars: ✭ 268 (+378.57%)
Mutual labels:  exploratory-data-analysis, eda
Dataprep
DataPrep — The easiest way to prepare data in Python
Stars: ✭ 639 (+1041.07%)
Mutual labels:  exploratory-data-analysis, eda
Sweetviz
Visualize and compare datasets, target values and associations, with one line of code.
Stars: ✭ 1,851 (+3205.36%)
Mutual labels:  exploratory-data-analysis, eda
Sparkora
Powerful rapid automatic EDA and feature engineering library with a very easy to use API 🌟
Stars: ✭ 51 (-8.93%)
Mutual labels:  exploratory-data-analysis, eda
Data Describe
data⎰describe: Pythonic EDA Accelerator for Data Science
Stars: ✭ 269 (+380.36%)
Mutual labels:  exploratory-data-analysis, eda
Hn so analysis
Is there a relationship between popularity of a given technology on Stack Overflow (SO) and Hacker News (HN)? And a few words about causality
Stars: ✭ 94 (+67.86%)
Mutual labels:  exploratory-data-analysis, eda
Complete Life Cycle Of A Data Science Project
Complete-Life-Cycle-of-a-Data-Science-Project
Stars: ✭ 140 (+150%)
Mutual labels:  exploratory-data-analysis, eda
Ditching Excel For Python
Functionalities in Excel translated to Python
Stars: ✭ 172 (+207.14%)
Mutual labels:  exploratory-data-analysis, eda
100 Days Of Ml Code
A day to day plan for this challenge. Covers both theoritical and practical aspects
Stars: ✭ 172 (+207.14%)
Mutual labels:  exploratory-data-analysis, eda
olliePy
OlliePy is a python package which can help data scientists in exploring their data and evaluating and analysing their machine learning experiments by utilising the power and structure of modern web applications. The data scientist only needs to provide the data and any required information and OlliePy will generate the rest.
Stars: ✭ 46 (-17.86%)
Mutual labels:  exploratory-data-analysis, eda
Exploratory Data Analysis Visualization Python
Data analysis and visualization with PyData ecosystem: Pandas, Matplotlib Numpy, and Seaborn
Stars: ✭ 78 (+39.29%)
Mutual labels:  exploratory-data-analysis, eda
skimpy
skimpy is a light weight tool that provides summary statistics about variables in data frames within the console.
Stars: ✭ 236 (+321.43%)
Mutual labels:  exploratory-data-analysis, eda
ConTexto
Librería en Python para minería de texto y NLP
Stars: ✭ 43 (-23.21%)
Mutual labels:  espanol, ucd
Scattertext
Beautiful visualizations of how language differs among document types.
Stars: ✭ 1,722 (+2975%)
Mutual labels:  exploratory-data-analysis, eda
Inspectdf
🛠️ 📊 Tools for Exploring and Comparing Data Frames
Stars: ✭ 195 (+248.21%)
Mutual labels:  exploratory-data-analysis, eda
dqlab-career-track
A collection of scripts written to complete DQLab Data Analyst Career Track 📊
Stars: ✭ 53 (-5.36%)
Mutual labels:  exploratory-data-analysis, data-quality
wal
WAL enables programmable waveform analysis.
Stars: ✭ 36 (-35.71%)
Mutual labels:  eda
Kaggle
Kaggle Kernels (Python, R, Jupyter Notebooks)
Stars: ✭ 26 (-53.57%)
Mutual labels:  exploratory-data-analysis

LEILA - Librería de calidad de datos

screenshot

PyPI version fury.io PyPI pyversions PyPI license Downloads GitHub forks

Descripción

La librería de calidad de datos tiene como objetivo principal ser una herramienta que facilite la verificación de contenido de bases de datos y dé métricas de calidad para que usuarios puedan decidir si sus bases de datos necesitan modificarse para ser utilizadas en los proyectos. La librería fue escrita en el lenguaje de programación de Python y puede analizar bases de datos estructurados que se conviertan en objetos tipo pandas.DataFrame. Contiene tres módulos principales, el módulo Calidad Datos para analizar cualquier base de datos, el módulo Datos gov para conectarse con los metadatos del Portal de Datos Abiertos de Colombia y utilizar sus bases de datos, y por último el módulo Reporte el cual permite generar un reporte de calidad utilizando los módulos anteriores.

La librería surge como resultado de un proyecto relacionado con realizar análisis descriptivos de la calidad de la información cargada al portal de Datos Abiertos de Colombia, durante el desarrollo del proyecto se identifica el interés por parte de diferentes actores en el proyecto al igual que el beneficio potencial de tener a la mano una librería que facilite describir la calidad de una base de datos, lo cual motivó a realizar la implementación de la librería.

Ejemplo

La librería permite generar un reporte de calidad de datos el cual contiene información descriptiva del dataframe analizado, a continuación se presenta el código requerido para generar un reporte a partir de un archivo en Excel en formato .xlsx.

from leila.reporte import generar_reporte

generar_reporte(datos='datosDeInteres.xlsx')

screenshot

Documentación

La librería cuenta con una documentación que detalla las funciones que la conforman, al igual que ejemplos de uso y demás información de interés relacionada con esta, para acceder a la documentación siga el siguiente link:

Documentación - LEILA - Librería de calidad de datos.

Instalación

Para la instalación de la librería se recomienda utilizar el gestor de paquetes pip, por buenas prácticas se sugiere antes de la instalación crear un entorno virtual que permita aislar las librerías y evitar conflictos de versiones con el entorno de desarrollo base del computador.

pip install leila

De manera alterna también puede utilizar el gestor de paquetes conda.

conda install -c ucd-dnp -c conda-forge leila

Control de cambios

Para ver todos los cambios en las versiones de LEILA ver el archivo changelog

Contribuciones a LEILA

Todas las contribuciones, reportes de errores, corrección de errores, las mejoras de la documentación y las ideas son bienvenidas.

Puede encontrar una descripción detallada de cómo contribuir en la Wiki de LEILA

También lo invitamos a revisar el 📆 Tablero TODO de LEILA, donde hay una serie de temas listados en los que el equipo UCD se encuentra trabajando.

Licencia MIT license

MIT License

La librería LEILA - Calidad de datos se encuentra publicada bajo la licencia MIT
Copyleft (c) 2020 - 2021 Departamento Nacional de Planeación - DNP Colombia

Para mayor información puede consultar el archivo de Licencia

Contacto

Para comunicarse con la Unidad de Científicos de Datos (UCD) de la Dirección de Desarrollo Digital (DDD) del DNP, lo puede hacer mediante el correo electrónico [email protected]

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].