Este material proporciona una base de conocimientos prácticos en el uso de herramientas como Jupyter, Google Colab y la biblioteca Pandas para el tratamiento, limpieza, integración y análisis de datos en el contexto de la ciencia de datos y big data.
El material abarca desde la creación y manipulación de estructuras como Series y DataFrames, hasta técnicas fundamentales de preprocesamiento como filtrado, agrupamiento, ordenamiento, combinaciones (joins), limpieza de datos, tratamiento de valores faltantes o duplicados, manejo de outliers y transformación de datos.
Además, se profundiza en la integración de DataFrames con bases de datos, incluyendo lectura, inserción y actualización de registros, lo que permite vincular la teoría con aplicaciones prácticas en entornos reales.
Puedes consultar o descargar el documento completo del material en formato PDF desde el siguiente enlace:
Ver PDF