ANOVA de medidas repetidas

Última actualización

Transcripción

Ver video solo

Revisores de contenido

Colaboradores/as

El análisis de la varianza, o ANOVA, es un tipo de prueba estadística paramétrica que se utiliza para determinar si existe una diferencia significativa entre las medias o promedios de tres o más grupos. La significación se define normalmente por un valor de p inferior a 0,05, es decir, al 5%.

Cuando se realiza una prueba paramétrica, es preciso hacer tres suposiciones clave sobre la población. En primer lugar, la población de la muestra debe haber sido reclutada aleatoriamente. La elección de los nombres aleatoriamente garantiza que las personas incluidas en el estudio tendrán características similares a las de la población diana. Esto es importante, porque asegura que los resultados de la prueba se pueden aplicar a la población diana, lo que significa que tiene una buena validez externa. El segundo supuesto establece que cada persona de la muestra fue reclutada de manera independiente con respecto a las demás. En otras palabras, ninguna persona influyó en la inclusión o no de otra en el estudio. Por ejemplo, si dos amigos decidieran medirse la presión arterial el mismo día y ambos estuvieran incluidos en el estudio, estas dos personas no serían independientes entre sí y no se cumpliría la segunda hipótesis. Al igual que el muestreo aleatorio, el reclutamiento independiente de personas es importante, porque garantiza que la población de la muestra se aproxima a la población diana. El tercer supuesto es que el tamaño de la muestra es lo suficientemente grande como para aproximarse a la población diana, lo que en general significa que es de más de 20 personas. Si es imposible conseguir un tamaño de muestra grande, entonces la población de la muestra debe seguir una distribución normal en forma de campana para la característica que se estudia, porque es lo que esperaríamos ver en la población diana.

Supongamos que hay un determinado fármaco para la presión arterial, llamado fármaco A, y se quiere averiguar si ayuda a reducir la presión arterial sistólica después de tomarlo durante tres meses y durante seis meses, respectivamente. Así pues, se toman 10 personas y se les da a cada una de ellas el fármaco A. A continuación, se mide la presión arterial sistólica de cada una de ellas en el instante 1 (en el que se les administra inicialmente el fármaco) y luego se vuelve a medir en el instante 2, por ejemplo, 3 meses después, y en el instante 3, es decir, 6 meses después de que hayan empezado a tomar la medicación. Se descubre que la medición de la presión arterial sistólica media en el instante 1 es de 138; en el instante 2 es de 132, y en el instante 3 es de 130. El siguiente paso consiste averiguar si 138, 132 y 130 son significativamente diferentes entre sí, para lo cual se recurre a una prueba ANOVA.

En concreto, se elegiría una prueba ANOVA de medidas repetidas, porque se está analizando el mismo grupo de personas en múltiples períodos de tiempo. En una prueba ANOVA de medidas repetidas, el tiempo es la variable independiente y, en este ejemplo, la variable dependiente es la presión arterial sistólica. Podría resultar tentador pensar que, en este estudio, el tipo de medicación es la variable independiente, pero no sucede así, ya que todos los participantes en dicho estudio toman el mismo tipo de medicación.

La prueba ANOVA de medidas repetidas es diferente a la prueba ANOVA unifactorial independiente, que examina varios grupos de personas en un punto temporal. Por ejemplo, supongamos que hay tres fármacos llamados A, B y C. Una prueba ANOVA unifactorial compararía las mediciones de la presión arterial sistólica de las personas que han estado tomando uno de los tres tipos de fármacos durante 6 meses. En este ejemplo, el tipo de medicación sería la variable independiente, y no el tiempo, porque se mide la presión arterial de todas las personas del estudio en el mismo instante.

Normalmente, una prueba ANOVA de medidas repetidas parte de dos hipótesis. La primera es la hipótesis nula, y sostiene que las medias de cada grupo son iguales. En otras palabras, la hipótesis nula indica que la media de la presión arterial sistólica es la misma para las personas en el tiempo 1, 2 y 3. La segunda hipótesis es la hipótesis alternativa, y afirma que al menos la media de un grupo es significativamente diferente de las demás. Así, la hipótesis alternativa en nuestro ejemplo es que la media de la presión arterial sistólica no es la misma para las personas en el tiempo 1, 2 y 3. Una cosa importante que hay que saber es que el ANOVA no dice qué media del grupo es diferente a la de los demás o si la media es mayor o menor; simplemente indica que las medias de los grupos no son iguales.

Para probar estas hipótesis se siguen seis pasos. El primer paso consiste en calcular la media de cada grupo individual y la media global o general, que es la media de las mediciones de la presión arterial de todos los grupos. Como las medias de cada grupo son 138, 132 y 130, podemos calcular la media global sumando cada grupo, es decir, 138 más 132 más 130, lo que supone 400. A continuación, se divide entre el número de grupos, que es 3. Así, la media global es 400 dividido entre 3, es decir, aproximadamente 133.

El segundo paso es hallar la variación entre grupos, que también se denomina suma de cuadrados entre tratamientos, o SSB, por sus siglas en inglés. La suma de cuadrados entre tratamientos es una medida de la semejanza de la media de cada grupo con la media general. Para hallar la suma de cuadrados entre tratamientos, primero se resta la media de cada grupo de la media global y se eleva al cuadrado, lo que se denomina diferencia al cuadrado. A continuación, se multiplica la diferencia al cuadrado por el número de personas de ese grupo. En una prueba ANOVA de medidas repetidas, el número de personas en cada grupo se mantiene constante, a menos que las personas abandonen el estudio en el transcurso del mismo. En este ejemplo, hay 10 personas en cada grupo. Así, para el tiempo 1, restamos la media de la presión arterial del grupo del tiempo 1, que es 138, de la media general, que es 133, lo cual es igual a -5. La diferencia al cuadrado es -5 al cuadrado, o 25, y 25 por 10 es 250. Para el grupo del tiempo 2, la media es 132, por lo que 133 menos 132 es 1, y 1 al cuadrado sigue siendo 1, de manera que 1 por 10 es igual a 10. Para el grupo del tiempo 3, la media es 130, por lo que 133 menos 130 es 3. 3 al cuadrado es 9, y 9 por 10 es 90. Ahora que tenemos los valores de cada grupo, los sumamos para obtener la suma de cuadrados entre tratamientos. Así, 10 más 250 más 90 es 350. Una suma de cuadrados entre tratamientos más alta indica que las medias de los grupos y la media general están dispersas o son diferentes entre sí, mientras que si la suma de cuadrados entre tratamientos es baja, señala que las medias de los grupos son bastante similares a la media general.

El tercer paso en el cálculo del ANOVA consiste en determinar la variación dentro del grupo, que también se denomina suma de cuadrados dentro del tratamiento, o SSW, por sus siglas en inglés. La suma de los cuadrados dentro del tratamiento es una medida de la similitud de cada medición individual de la presión arterial con respecto a la media de su propio grupo. Para calcular la suma de los cuadrados dentro del tratamiento, primero se hallan las diferencias al cuadrado de cada persona de un grupo y, para ello, se toma cada medida individual de la presión arterial, se resta la media de ese grupo y se eleva al cuadrado. Por ejemplo, tomemos las 3 primeras mediciones de la presión arterial sistólica en el grupo del tiempo 1, que son 129, 142 y 143. Dado que la media del grupo es 138, se resta 138 a cada medida individual, de modo que 129 menos 138 es -9, 142 menos 138 es 4 y 143 menos 138 es 5. A continuación, se eleva al cuadrado cada número y se suman todos para obtener la diferencia al cuadrado, de modo que cuando se suman el -9 al cuadrado, o sea 81, y el 4 al cuadrado, o sea 16, y el 5 al cuadrado, o sea 25, se obtiene 122.

La diferencia al cuadrado es mayor para los grupos con más personas, así que digamos que la diferencia al cuadrado del grupo de tiempo 1 es de 330, y las diferencias al cuadrado de los grupos de tiempo 2 y del tiempo 3 son 310 y 265. Como regla general, si todos los grupos tienen tamaños de muestra iguales (por ejemplo, cada grupo cuenta con 10 personas) entonces los grupos con diferencias cuadradas más altas, como el grupo del tiempo 1, tienen más variación que los que tienen diferencias cuadradas menores, como el grupo del tiempo 3. En otras palabras, las mediciones individuales de la presión arterial de las personas del grupo del tiempo 1 están más repartidas que las de las personas del grupo del tiempo 3. Para obtener la suma de cuadrados dentro del tratamiento, se suman todas las diferencias al cuadrado de cada grupo. Así que 330 más 310 más 265 es igual a 905.

Para realizar el paso 4, tenemos que saber un poco más sobre la suma de cuadrados dentro del tratamiento. La suma de cuadrados dentro del tratamiento se compone de la variación para cada sujeto, que también se denomina suma de cuadrados de los sujetos, o SSs, por sus siglas en inglés, y del error aleatorio, que recibe también el nombre de suma de errores cuadráticos, o SSE, por sus siglas en inglés. Los valores de la suma de cuadrados de los sujetos y de la suma de errores cuadráticos se añaden al valor de la suma de cuadrados dentro del tratamiento.

Aspectos destacados

en inglés

Analysis of variance, or simply, ANOVA, is a type of parametric test used to compare the means of multiple groups. It is used to determine if there's a significant difference between the means or averages of three or more groups. Repeated measures ANOVA help to analyze change among these means over different times, and it is widely used in fields such as psychology, medicine, and biology.