Cuando un conjunto de datos tiene algunos casos muy extremos.
Ejemplo: tenemos un conjunto de datos de 1000 en el que la mayoría de los valores se sitúan alrededor de la marca 1000. Digamos que la media y la mediana son ambos 1000. Ahora agregamos un 'millonario'. La media aumentará dramáticamente a casi 2000, mientras que la mediana no cambiará realmente, porque será el valor del caso 501 en lugar del intermedio del caso 500 y el caso 501 (casos organizados en orden de valor)
La media es la medida de centro más utilizada, pero en ocasiones se recomienda usar la mediana para la visualización y el análisis de datos. ¿Cuándo podría ser apropiado usar la mediana en lugar de la media?
Cuando hay algunos valores extremos en su conjunto de datos. Ejemplo: tiene un conjunto de datos de 1000 casos con valores no muy separados. Su media es de 100, al igual que su mediana. Ahora reemplaza solo un caso por un caso que tiene un valor de 100000 (solo para ser extremo). La media aumentará dramáticamente (hasta casi 200), mientras que la mediana no se verá afectada. Cálculo: 1000 casos, media = 100, suma de valores = 100000 Pierde uno 100, sume 100000, suma de valores = 199900, media = 199.9 Mediana (= caso 500 + 501) / 2 permanece igual.
La mediana se llama medida resistente, mientras que la media es una medida no resistente. ¿Qué es una medida resistente?
Resistente en este caso significa que puede soportar valores extremos. Ejemplo: imagine un grupo de 101 personas que tienen un promedio (= promedio) de $ 1000 en el banco. También sucede que el intermediario (después de clasificar en el saldo del banco) también tiene $ 1000 en el banco. Esta mediana significa que 50 (%) tienen menos y 50 tienen más. Ahora uno de ellos gana un premio de lotería de $ 100000 y decide depositarlo en el banco. La media subirá inmediatamente de $ 1000 a cerca de $ 2000, ya que se calcula dividiendo la cantidad total por 101. La mediana ("mitad de la fila")
Decimos que la mediana es una medida resistente, mientras que la media no es una medida resistente. ¿Qué es una medida resistente?
Una medida resistente es aquella que no está influenciada por valores atípicos.Por ejemplo, si tenemos una lista ordenada de números: 1, 3, 4, 5, 6, 8, 50 La media es: 11 La mediana es 5 La media en este caso es mayor que la mayoría de los números en la lista porque Está muy influenciado por 50, en este caso un fuerte valor atípico. La mediana se mantendría en 5, incluso si el último número en la lista ordenada fuera mucho más grande, ya que simplemente proporciona el número del medio en una lista ordenada de números.