# Introducci贸n al manejo de datos en Python 馃悕
---
**Sobre el curso:** Este curso tiene por finalidad el aprendizaje pr谩ctico de Python orientado al manejo b谩sico y sencillo de datos.
# **Sesi贸n 2: Manejo b谩sico de datos en Python**
En esta segunda sesi贸n, vamos a importar y trabajar con Pandas para explorar sus funcionalidades b谩sicas.
## **1. Importar Pandas**
Una vez instalado, podemos importar Pandas para comenzar a trabajar con datos:
```python
import pandas as pd
```
## **2. Importar datos**
Pandas soporta la lectura de una variedad de formatos de archivos como CSV, Excel entre otros. El m茅todo `read_csv` es frecuentemente usado:
```python
df = pd.read_csv('ruta/al/archivo.csv', sep=',', header=0)
```
**Par谩metros principales:**
- `filepath_or_buffer`: Ruta del archivo o un objeto similar a un archivo que contiene los datos.
- `sep`: el delimitador del archivo (por defecto, `,`).
- `header`: 铆ndice de la fila que se usa como cabecera.
- `skiprows`: N煤mero de filas o lista de n煤meros de l铆nea para omitir al leer el archivo.
- `na_values`: Secuencia de valores que, si se encuentran en el archivo, deben ser tratados como NaN.
- `dtype`: Tipo de datos para las columnas. Por ejemplo, {'a': np.float64, 'b': np.int32}.
- `encoding`: Codificaci贸n del archivo (generalmente UTF-8).
### **3. Previsualizaci贸n de datos**
Para obtener una vista r谩pida de los datos, podemos utilizar:
```python
df.head() # Muestra las primeras 5 filas
```
Tambi茅n puede usar:
- `head()`, `tail()`: Muestra las primeras o 煤ltimas 'n' filas.
- `describe()`: Proporciona estad铆sticas descriptivas resumidas.
- `info()`: Resumen conciso del DataFrame, incluyendo el tipo de datos de las columnas y los valores no nulos.
- `dtypes`: Muestra los tipos de datos de cada columna.
- `value_counts()`: Cuenta cu谩ntas veces aparece cada valor 煤nico en una columna.
### **4. Seleccionar columnas**
Para seleccionar una sola columna, utilizamos:
```python
columna = df['NombreColumna']
```
### **5. Seleccionar filas por 铆ndice**
Podemos seleccionar filas espec铆ficas usando su 铆ndice:
```python
filas = df.iloc[0:5] # Selecciona las primeras 5 filas
```
### **6. Seleccionar filas usando condiciones**
Tambi茅n podemos seleccionar filas que cumplan una condici贸n:
```python
condicion = df[df['Edad'] > 30] # Selecciona filas donde la columna 'Edad' es mayor que 30
```
### **7. Exportar a CSV**
Para exportar un DataFrame a CSV, utilizamos:
```python
df.to_csv('ruta/al/nuevo_archivo.csv', index=False)
```
**Par谩metros principales:**
- `index`: indica si incluir el 铆ndice de las filas en el archivo.
- `sep`: el delimitador del archivo (por defecto, `,`).
- `encoding`: Codificaci贸n del archivo (generalmente UTF-8).
---
# Informaci贸n
<div class="alert alert-block alert-info">
<b>Autor:</b> Wenceslao Arroyo-Machado</br>
<b>Fecha de actualizaci贸n:</b> 26/04/2024</br>
<b>GitHub:</b> <a href="https://github.com/Wences91/teaching">https://github.com/Wences91/teaching</a>
</div>