6. Transformación de los Datos
La transformación Box-Cox es una de las formas posibles de resolver problemas de datos que no cumplen con los supuestos del análisis de varianza, como la normalidad de los datos.
Ejemplo 1:
Para determinados análisis es necesario que los datos presenten una distribución normal. Un estudio verificó que las 11 medidas de peso de las piezas (en libras) no siguen esa distribución. Por lo tanto, es necesario aplicar una transformación para solucionar el problema.
| Peso de la pieza |
|---|
| 148 |
| 154 |
| 158 |
| 160 |
| 161 |
| 162 |
| 166 |
| 170 |
| 182 |
| 195 |
| 236 |
A continuación, haremos un Upload en el sistema.

Se realizará a transformación de los datos.

En seguida, haga un clic en Calcular para obtener los resultados. También es posible generar los análisis y descargar en el formato Word.

Los resultados son:
| Transformación Box-Cox |
| V1 | |
|---|---|
| lambda | -2.500 |
| P-Valor (Anderson-Darling) | 0.309 |
Datos transformados
| Datos |
|---|
| 0.4 |
| 0.4 |
| 0.4 |
| 0.4 |
| 0.4 |
| 0.4 |
| 0.4 |
| 0.4 |
| 0.4 |
| 0.4 |
| 0.4 |
Outliers (Cuantiles)
| Obs. | Cuantiles de la Normal | Datos | Criterio |
|---|---|---|---|
| 11 | $\qquad\qquad$1.69 | 0.4 | Banda de confianza (Nivel de Confianza=95%) |


El gráfico QQ-plot muestra que se cumple el supuesto de normalidad, y también obtenemos un P valor de 0.309 en la prueba de Anderson-Darling, lo que indica que los datos siguen una distribución normal. Observamos que la observación número 11 está fuera de la banda de confianza del gráfico QQ-plot, pero esto no invalida el supuesto de normalidad de los datos transformados.
Por lo tanto, utilizando los datos transformados es posible continuar el estudio, ya que se cumple el supuesto de normalidad de los datos.
Ejemplo 2:
Considere una muestra con 32 observaciones del volumen de un frasco de medicamento. Los datos de la muestra no siguen una distribución normal, por lo que es necesario normalizarlos para continuar con los análisis.
| volume |
|---|
| 30.39 |
| 31.33 |
| 31.06 |
| 31.19 |
| 31.09 |
| 31.16 |
| 31.17 |
| 30.82 |
| 31.3 |
| 30.84 |
| 31.01 |
| 30.84 |
| 31.23 |
| 31.55 |
| 31.69 |
| 32.92 |
| 32.78 |
| 32.92 |
| 32.01 |
| 30.06 |
| 30.31 |
| 31.44 |
| 30.96 |
| 30.98 |
| 31.44 |
| 31.41 |
| 31.99 |
| 31.2 |
| 31.21 |
| 31.1 |
| 32.5 |
| 32.31 |
Subiremos los datos al sistema.

Se realizará una transformación de los datos.
–

En seguida, haga un clic en Calcular para obtener los resultados. También es posible generar los análisis y descargar en el formato Word.

Los resultados son:
| Transformación Johnson |
Estimativas
| Prueba | |
|---|---|
| Gama | -0.404546625366474 |
| Lamdba | 0.178551759842957 |
| Epsilon | 31.0975476436831 |
| Eta | 0.596015901747296 |
| Familia | SU |
| P-valor (Anderson-Darling) | 0.7745 |
Datos Transformados
| Datos |
|---|
| -1.648 |
| 0.239 |
| -0.529 |
| -0.108 |
| -0.430 |
| -0.200 |
| -0.169 |
| -1.134 |
| 0.175 |
| -1.097 |
| -0.686 |
| -1.097 |
| 0.005 |
| 0.585 |
| 0.737 |
| 1.395 |
| 1.347 |
| 1.395 |
| 0.986 |
| -1.871 |
| -1.710 |
| 0.434 |
| -0.827 |
| -0.773 |
| 0.434 |
| 0.386 |
| 0.974 |
| -0.079 |
| -0.050 |
| -0.396 |
| 1.239 |
| 1.153 |
