6. Transformación de los Datos

La transformación Box-Cox es una de las formas posibles de resolver problemas de datos que no cumplen con los supuestos del análisis de varianza, como la normalidad de los datos.

Ejemplo 1:

Para determinados análisis es necesario que los datos presenten una distribución normal. Un estudio verificó que las 11 medidas de peso de las piezas (en libras) no siguen esa distribución. Por lo tanto, es necesario aplicar una transformación para solucionar el problema.

Peso de la pieza
148
154
158
160
161
162
166
170
182
195
236

A continuación, haremos un Upload en el sistema.


Se realizará a transformación de los datos.



En seguida, haga un clic en Calcular para obtener los resultados. También es posible generar los análisis y descargar en el formato Word.


Los resultados son:

Transformación Box-Cox
V1
lambda -2.500
P-Valor (Anderson-Darling) 0.309

Datos transformados

Datos
0.4 
0.4 
0.4 
0.4 
0.4 
0.4 
0.4 
0.4 
0.4 
0.4 
0.4 

Outliers (Cuantiles)

Obs. Cuantiles de la Normal Datos Criterio
11 $\qquad\qquad$1.69 0.4 Banda de confianza (Nivel de Confianza=95%)

El gráfico QQ-plot muestra que se cumple el supuesto de normalidad, y también obtenemos un P valor de 0.309 en la prueba de Anderson-Darling, lo que indica que los datos siguen una distribución normal. Observamos que la observación número 11 está fuera de la banda de confianza del gráfico QQ-plot, pero esto no invalida el supuesto de normalidad de los datos transformados.

Por lo tanto, utilizando los datos transformados es posible continuar el estudio, ya que se cumple el supuesto de normalidad de los datos.

Ejemplo 2:

Considere una muestra con 32 observaciones del volumen de un frasco de medicamento. Los datos de la muestra no siguen una distribución normal, por lo que es necesario normalizarlos para continuar con los análisis.

volume
30.39
31.33
31.06
31.19
31.09
31.16
31.17
30.82
31.3
30.84
31.01
30.84
31.23
31.55
31.69
32.92
32.78
32.92
32.01
30.06
30.31
31.44
30.96
30.98
31.44
31.41
31.99
31.2
31.21
31.1
32.5
32.31

Subiremos los datos al sistema.


Se realizará una transformación de los datos.


En seguida, haga un clic en Calcular para obtener los resultados. También es posible generar los análisis y descargar en el formato Word.


Los resultados son:

Transformación Johnson

Estimativas

Prueba
Gama -0.404546625366474
Lamdba 0.178551759842957
Epsilon 31.0975476436831
Eta 0.596015901747296
Familia SU
P-valor (Anderson-Darling) 0.7745

Datos Transformados

Datos
-1.648
0.239
-0.529
-0.108
-0.430
-0.200
-0.169
-1.134
0.175
-1.097
-0.686
-1.097
0.005
0.585
0.737
1.395
1.347
1.395
0.986
-1.871
-1.710
0.434
-0.827
-0.773
0.434
0.386
0.974
-0.079
-0.050
-0.396
1.239
1.153