Error estándar de la media (Teorema Central del Límite)

9,226visualizaciones

Error estándar de la media (Teorema Central del Límite)

Distribuciones de datos

Transcripción

Ver video solo

Supongamos que se pregunta a 1.000 hombres por su peso y luego se representan esos pesos en un histograma, que es un tipo de gráfico que muestra la distribución de medidas o datos.

Digamos que la mayoría de los hombres pesan lo mismo que la media (que en este caso podría ser de alrededor de 77 kilogramos), mientras que un número menor de hombres pesa un poco más o un poco menos que la media, y aún menos hombres pesan mucho más o mucho menos que la media.

Si dibujamos una curva sobre nuestro histograma, obtenemos la curva de distribución normal, que también se llama curva de campana, porque tiene esta forma acampanada.

La curva de campana es simétrica, con la mitad de los datos a la izquierda de la media y la mitad de los datos a la derecha de la media.

El área bajo la curva de campana es igual a 1, es decir, el 100%, con el mayor porcentaje de datos en la sección central y el menor porcentaje de datos en las colas exteriores de la curva.

Por lo general, para los datos de la población, el punto medio de una curva de campana se etiqueta con la letra griega mu, y mu se refiere a la media, la mediana y la moda, porque cuando los datos se reparten según una distribución normal, la media, la mediana y la moda son iguales entre sí.

La desviación típica es una medida de la dispersión de los datos con respecto a la media, y para los datos de población se representa con la letra griega minúscula sigma.

Por ejemplo, supongamos que la desviación típica del peso de nuestra muestra de hombres es de 13 kilogramos.

En una distribución normal, el 68% de los datos están dentro de una desviación típica.

Esto significa que el 68% de los hombres pesarán entre 77 menos 13, o 64 kg, y 77 más 13, o 90 kg.

Además, el 95% de los datos se encuentran dentro de las dos desviaciones típicas, así que, como 13 por 2 es 26, entonces el 95% de los hombres pesarán entre 77 menos 26, o 51 kg, y 77 más 26, o 103 kg.

Por último, el 99,7% de los datos se encuentran dentro de tres desviaciones típicas, y como 13 por 3 es 39, el 99,7% de los hombres pesarán entre 77 menos 39, o sea 38 kg, y 77 más 39, o sea 116 kg.

Esta es la regla empírica, o regla del 68-95-99,7.

Ahora, la forma de la curva de campana depende del tamaño de la desviación típica.

Una desviación típica reducida, como si fuera de solo 5 kg, indica que la mayoría de los datos se agrupan en torno a la media, y esto hace que la curva de campana sea muy alta y delgada.

Por otro lado, una gran desviación típica, por ejemplo de 2,5 kg, indica que la mayoría de los datos están muy por encima y muy por debajo de la media, lo que hace que la curva de campana parezca muy amplia y plana.

También es posible que la población de 1.000 hombres tenga una distribución sesgada en lugar de una distribución normal, lo que significa que una cola de la curva de campana es más larga que la otra.

Una distribución sesgada a la derecha significa que la cola derecha es más larga que la cola izquierda, y una distribución sesgada a la izquierda quiere decir que la cola izquierda es más larga que la cola derecha.

Normalmente, cuando la distribución está sesgada, la media, la mediana y la moda no son iguales.

A menudo es imposible recoger mediciones de todas las personas de la población, por lo que elegimos una muestra que es básicamente un pequeño número de personas que creemos que representan al grupo más amplio.

Como regla general, si recogemos la muestra de forma aleatoria, es decir, si las personas se eligen únicamente por azar, esperamos que esa muestra tenga características similares (como la misma distribución de peso) a las de la población de la que se han elegido.

Y si los dos grupos tienen características similares, también esperamos que la media y la desviación estándar sean iguales en los dos grupos.

Por ejemplo, supongamos que tomamos al azar una muestra de 50 hombres de la población total de 1000 hombres.

Si la población tiene un peso medio de 77 kilos y una desviación estándar de 13 kilos, también esperamos que la muestra tenga un peso medio de 77 kilos y una desviación estándar de 13 kilos.

Pero en algunos casos la muestra que recojamos no tendrá una media de exactamente 77 kilos.

Por ejemplo, una muestra aleatoria de personas puede pesar más que la media de la población, por lo que la media de la muestra será mayor que la media de la población.

Aspectos destacados

en inglés

Central limit theorem states that if the desired data is obtained repeatedly from random samples and the mean is calculated for each sample, these means will form a normal Gaussian curve.This curve will always be normal regardless to the shape of the original curve. The standard deviation of this curve is called the standard error of mean.The standard error of mean does not measure the dispersion of data but measures how much the sample represents the population. It is directly proportional to standard deviation and inversely proportional to sample size.