¿Cuál es el teorema del límite central?

¿Cuál es el teorema del límite central?
Anonim

Responder:

El teorema del límite central hace rigurosa la idea intuitiva de que las estimaciones de la media (estimada a partir de alguna muestra) de alguna medida asociada con alguna población mejoran a medida que aumenta el tamaño de la muestra.

Explicación:

Imagina un bosque que contiene 100 árboles.

Ahora imagine que (de manera poco realista) que, medidos en metros, una cuarta parte de ellos tiene una altura de 2, una cuarta parte de ellos tiene una altura de 3, una cuarta parte de ellos tiene una altura de 4 y una cuarta parte de ellos tiene una altura de 5.

Imagine medir la altura de cada árbol en el bosque y usar la información para construir un histograma con tamaños de cubos adecuadamente seleccionados (por ejemplo, 1.5 a 2.5, 2.5 a 3.5, 3.5 a 4.5 y 5.5 a 6.5; me doy cuenta de que no he especificado el contenedor al que pertenecen los límites pero no importa aquí).

Podría usar el histograma para estimar la distribución de probabilidad de los árboles. Claramente, no sería una normal.De hecho, siempre que los puntos finales se eligieran de manera adecuada, sería uno uniforme porque habría un número igual de árboles correspondiente a una de las alturas especificadas en cada contenedor.

Ahora imagine ir al bosque y medir la altura de solo dos árboles; calcule la altura media de estos dos árboles y anótela. Repita esa operación varias veces, de modo que tenga una colección de los valores medios para muestras de tamaño 2. Si tuviera que trazar un histograma de las estimaciones de la media, ya no sería uniforme. En cambio, es probable que haya más mediciones (estimaciones de la media basadas en muestras de tamaño 2) cerca de la altura media general de todos los árboles en el bosque (en este caso particular,

#(2 + 3 + 4 + 5)/4 = 3.5# metros).

Como habría más estimaciones de la media cerca de media poblacional verdadera (lo que se conoce en este ejemplo no realista), muy lejos de la media, la forma de este nuevo histograma estaría más cerca de una distribución normal (con un pico cerca de la media).

Ahora imagine ir al bosque y repetir el ejercicio, excepto que usted mide la altura de 3 árboles, calculando la media en cada caso y tomando nota de ello. El histograma que usted construiría tendría incluso más estimaciones de la media cerca de la media verdadera, con una menor propagación (la posibilidad de recoger tres árboles en cualquier muestra, de modo que todos provengan de cualquiera de los grupos finales, o bien alto o muy corto --- es menos que recoger tres árboles con una selección de alturas). La forma de su histograma que comprende una estimación del tamaño medio (cada media basada en tres mediciones) sería más cercana a la de una distribución normal y la desviación estándar correspondiente (de las estimaciones de la media, no de la población matriz) sería menor.

Repita esto para 4, 5, 6, etc., árboles por media, y el histograma que construiría se parecería cada vez más a una distribución normal (con tamaños de muestra progresivamente más grandes), con la media de distribución de la estimaciones de la media estar más cerca de la media real, y la desviación estándar de las estimaciones de la media cada vez más estrecha.

Si repite el ejercicio para el caso (degenerado) en el que se miden todos los árboles (en varias ocasiones, tomando nota de la media en cada caso), el histograma tendrá estimaciones de la media solo en uno de los contenedores. (el que corresponde a la media real), sin ninguna variación, de modo que la desviación estándar de (la distribución de probabilidad estimada a partir de) de que "histograma" sería cero.

Por lo tanto, el teorema del límite central señala que la media de alguna estimación de la media de alguna población se aproxima asintóticamente a la media real, y la desviación estándar de la estimación de la media (en lugar de la desviación estándar de la distribución de la población parental) se vuelve progresivamente más pequeño para tamaños de muestra más grandes.