---
title: '[Layout] Two columns'
---
<style>
.two-column-layout {
column-count: 2; /* Set column number */
column-gap: 20px;
max-width: 100%;
overflow: hidden;
}
/* Media query for mobile devices */
@media (max-width: 768px) {
.two-column-layout {
column-count: 1; /* Switch to single column on small screens */
column-gap: 0; /* Optional: Set gap to 0 for single column */
}
}
.markdown-body, .ui-infobar {
max-width: unset !important;
}
.two-column-layout ul,
.two-column-layout ol {
margin: 0;
padding-left: 20px;
}
.two-column-layout strong {
font-weight: bold;
}
.two-column-layout em {
font-style: italic;
}
.two-column-layout h1,
.two-column-layout h2,
.two-column-layout h3,
.two-column-layout h4,
.two-column-layout h5,
.two-column-layout h6 {
margin-top: 0;
}
</style>
# Estándares de limpieza de datos
## Objetivo
Establecer un procedimiento integral de aseguramiento de calidad de datos, aplicable a cualquier fuente de información (archivos, bases de datos, sistemas, encuestas, registros operativos, etc.), con el fin de garantizar su integridad, consistencia, confiabilidad y utilidad para el análisis y la toma de decisiones.
## Alcance
Este plan se aplica a todos los datos que requieran validación y análisis, independientemente de su origen, tipo (numéricos, categóricos, textuales, temporales) o formato (Excel, CSV, SQL, reportes exportados).
Incluye únicamente la etapa de limpieza de datos inicial para dejar preparados los datos para su posterior consumo y análisis.
## Procedimiento de calidad de los datos
### Preparación y Estandarización
* Unificar formatos de fechas, horas y campos numéricos.
* Normalizar variables categóricas (ejemplo: “M” y “Masculino” deben estandarizarse a un único valor).
* Eliminar duplicados y registros sin información esencial.
### Validación de Datos
Se establecen pruebas generales de validación aplicables a cualquier conjunto de datos:
**Integridad**
* Verificar que los campos obligatorios no estén vacíos.
* Ejemplo: todo registro de ventas debe tener fecha, monto y cliente.
**Consistencia**
* Validar coherencia entre campos relacionados.
* Ejemplo: “fecha de inicio ≤ fecha de fin”.
**Rangos válidos**
* Comprobar que los valores estén dentro de los límites esperados.
* Ejemplo: edad > 0 y < 120.
**Formato correcto**
* Revisar que las entradas cumplan con el formato definido.
* Ejemplo: correos válidos (expresión regular), fechas en formato DD/MM/AAAA.
**Duplicidad**
* Identificar registros repetidos por ID, nombre o combinación de campos clave.
* Coherencia lógica / reglas de negocio
* Validar condiciones particulares según el contexto.
* Ejemplo: si “estado = completado” → debe existir fecha de finalización.
**Trazabilidad**
* Mantener registro de modificaciones, responsable y fecha de corrección.
### Referencia de pruebas de calidad de datos
#### I-MR
Al realizar este análisis se deberán seleccionar todas las pruebas de detección especiales (Western Electric Rules / Nelson Rules) las cuales están disponibles en la configuración del gráfico, se deberán activar todas las opciones disponibles en “Test for Special Causes”
Referencia de apoyo: [Seleccionar pruebas para detectar causas especiales para Gráfica I-MR ](//support.minitab.com/es-mx/minitab/help-and-how-to/quality-and-process-improvement/control-charts/how-to/variables-charts-for-individuals/i-mr-chart/perform-the-analysis/i-mr-options/select-tests-for-special-causes/?utm_source=chatgpt.com)
#### Prueba de normalidad Anderson-Darling
Realizar la prueba de normalidad Anderson–Darling tras haber finalizado la limpieza de datos atípicos, con el fin de determinar si el conjunto de datos sigue una distribución normal.
En el contexto de la prueba de normalidad Anderson–Darling, la interpretación del valor p es la siguiente:
*Si el **valor p** es mayor que el nivel de significancia (**α = 0.05** por convención), **no se rechaza la hipótesis nula de normalidad.***
Esto implica que no existe evidencia suficiente para afirmar que los datos NO son normales.
Por lo tanto:
Normalidad = p-value > 0.05 (no se rechaza la hipótesis de normalidad)
**NOTA IMPORTANTE:** Ninguna prueba estadística puede "asegurar" la normalidad de un conjunto de datos. Tanto la prueba Anderson–Darling como cualquier otra prueba de normalidad únicamente permiten determinar si existe o no evidencia suficiente para rechazar la hipótesis de normalidad.
En términos prácticos, estas pruebas ayudan a descartar que los datos NO sean normales, confirmando únicamente que los datos son compatibles con una distribución normal, más no que lo sean de manera absoluta.
Referencias:
[Prueba de normalidad](https://support.minitab.com/es-mx/minitab/help-and-how-to/statistics/basic-statistics/supporting-topics/normality/test-for-normality/)
[El estadístico de Anderson-Darling](https://support.minitab.com/es-mx/minitab/help-and-how-to/statistics/basic-statistics/supporting-topics/normality/the-anderson-darling-statistic/)
[Qué hacer con datos no normales](https://support.minitab.com/es-mx/minitab/help-and-how-to/statistics/basic-statistics/supporting-topics/normality/what-to-do-with-nonnormal-data/)
#### ANOVA
En los casos donde es necesario mostrar la significancia de una alguna mejora implementanda, será necesario realizar un análisis ANOVA de un factor. Siendo posible observar los resultados en gráfico de datos para ANOVA de un factor.
Para definir la significancia de la mejora, la media de cada grupo de datos debe ser completamente independiente de la otra.
Referencia:
[¿Qué es ANOVA?](https://support.minitab.com/es-mx/minitab/help-and-how-to/statistical-modeling/anova/supporting-topics/basics/what-is-anova/)
[Gráficas de datos para ANOVA de un solo factor](https://support.minitab.com/es-mx/minitab/help-and-how-to/statistical-modeling/anova/how-to/one-way-anova/interpret-the-results/all-statistics-and-graphs/data-plots/)