# Introducci贸n al manejo de datos en Python 馃悕 --- **Sobre el curso:** Este curso tiene por finalidad el aprendizaje pr谩ctico de Python orientado al manejo b谩sico y sencillo de datos. # **Sesi贸n 2: Manejo b谩sico de datos en Python** En esta segunda sesi贸n, vamos a importar y trabajar con Pandas para explorar sus funcionalidades b谩sicas. ## **1. Importar Pandas** Una vez instalado, podemos importar Pandas para comenzar a trabajar con datos: ```python import pandas as pd ``` ## **2. Importar datos** Pandas soporta la lectura de una variedad de formatos de archivos como CSV, Excel entre otros. El m茅todo `read_csv` es frecuentemente usado: ```python df = pd.read_csv('ruta/al/archivo.csv', sep=',', header=0) ``` **Par谩metros principales:** - `filepath_or_buffer`: Ruta del archivo o un objeto similar a un archivo que contiene los datos. - `sep`: el delimitador del archivo (por defecto, `,`). - `header`: 铆ndice de la fila que se usa como cabecera. - `skiprows`: N煤mero de filas o lista de n煤meros de l铆nea para omitir al leer el archivo. - `na_values`: Secuencia de valores que, si se encuentran en el archivo, deben ser tratados como NaN. - `dtype`: Tipo de datos para las columnas. Por ejemplo, {'a': np.float64, 'b': np.int32}. - `encoding`: Codificaci贸n del archivo (generalmente UTF-8). ### **3. Previsualizaci贸n de datos** Para obtener una vista r谩pida de los datos, podemos utilizar: ```python df.head() # Muestra las primeras 5 filas ``` Tambi茅n puede usar: - `head()`, `tail()`: Muestra las primeras o 煤ltimas 'n' filas. - `describe()`: Proporciona estad铆sticas descriptivas resumidas. - `info()`: Resumen conciso del DataFrame, incluyendo el tipo de datos de las columnas y los valores no nulos. - `dtypes`: Muestra los tipos de datos de cada columna. - `value_counts()`: Cuenta cu谩ntas veces aparece cada valor 煤nico en una columna. ### **4. Seleccionar columnas** Para seleccionar una sola columna, utilizamos: ```python columna = df['NombreColumna'] ``` ### **5. Seleccionar filas por 铆ndice** Podemos seleccionar filas espec铆ficas usando su 铆ndice: ```python filas = df.iloc[0:5] # Selecciona las primeras 5 filas ``` ### **6. Seleccionar filas usando condiciones** Tambi茅n podemos seleccionar filas que cumplan una condici贸n: ```python condicion = df[df['Edad'] > 30] # Selecciona filas donde la columna 'Edad' es mayor que 30 ``` ### **7. Exportar a CSV** Para exportar un DataFrame a CSV, utilizamos: ```python df.to_csv('ruta/al/nuevo_archivo.csv', index=False) ``` **Par谩metros principales:** - `index`: indica si incluir el 铆ndice de las filas en el archivo. - `sep`: el delimitador del archivo (por defecto, `,`). - `encoding`: Codificaci贸n del archivo (generalmente UTF-8). --- # Informaci贸n <div class="alert alert-block alert-info"> <b>Autor:</b> Wenceslao Arroyo-Machado</br> <b>Fecha de actualizaci贸n:</b> 26/04/2024</br> <b>GitHub:</b> <a href="https://github.com/Wences91/teaching">https://github.com/Wences91/teaching</a> </div>