Sobre el curso: Este curso está diseñado para fomentar el aprendizaje práctico de Python, con un enfoque en operaciones avanzadas de manejo de datos utilizando Pandas.
Esta sesión cubre técnicas principales de Pandas, incluyendo joins, búsqueda de cadenas, agregación de datos y visualizaciones.
En primer lugar, la combinación más básica de DataFrames es concatenando. Para ello se puede usar la función concat()
y mediante el parámetro axis
especificar si va a ser de manera vertical (0) u horizontal (1).
Los joins son esenciales para combinar DataFrames en base a una o más claves con merge()
. El parámetro how
indica cómo se hará el join (left, right, inner o outer).
Pandas permite la búsqueda dentro de series de texto usando métodos como str.contains()
.
Este método es compatible con expresiones regulares para búsquedas complejas en textos.
Una función básica es la del recuento de ocurrencia de valores únicos dentro de una columna con value_counts()
.
Sin embargo, Pandas también permite realizar operaciones de agregación para resumir datos a través de groupby()
.
Además, se pueden especificar varias operaciones de manera simultánea con agg()
.
Pandas tiene integrado Matplotlib, que permite crear una variedad de gráficos para analizar los datos visualmente de manera sencilla.