41 votos

¿Por qué es edad mediana una estadística mejor que edad media?

alt text

alt text

Claramente mediana parece ser la estadística de elección cuando se trata de las edades.

Yo no soy capaz de explicar a mí mismo por qué la media aritmética sería peor estadística. ¿Por qué es así?

Originalmente publicado aquí porque no sabía de este sitio existía.

42voto

jldugger Puntos 7490

Las estadísticas no dar una buena respuesta a esta pregunta, de la OMI. Un medio es aceptar a utilizar, también, y es relevante en estudios de mortalidad, por ejemplo. Pero las edades no son tan fáciles de medir como usted podría pensar: personas mayores, personas analfabetas, y la gente en algunos países del tercer mundo tienden a redondear sus edades a un múltiplo de 5 o 10, por ejemplo. La mediana es más resistente a este tipo de errores que la media. Por otra parte, la mediana de las edades son normalmente de 20 a 40, pero la gente puede llegar a vivir hasta 100 y más (un creciente y notable proporción de la población de los países modernos ahora vive más allá de los 100). Las personas de edad tienen de 1,5 a 4 veces la influencia en la media de lo que lo hacen en la mediana en comparación con gente muy joven. Por lo tanto, la mediana es un poco más arriba-a-fecha de estadísticas relativas a un país de la distribución de edad y es un poco más independiente de las tasas de mortalidad y esperanza de vida que la media es. Finalmente, la mediana nos da un poco mejor imagen de lo que la distribución por edad sí parece: cuando vea una mediana de 35, por ejemplo, sabe que la mitad de la población es mayor de 35 años y se pueden inferir algunas cosas acerca de las tasas de natalidad, las edades de los padres, y así sucesivamente; pero si la media es de 35 años, no se puede decir mucho, ya que el 35 podría estar influenciada por una gran cantidad de 70 años de edad, por ejemplo, o tal vez una población brecha en algún rango de edad debido a una antigua guerra o epidemia. Por lo tanto, para demográfico, no estadística, razones, una mediana parece más digno de la función de un omnibus de valor para resumir las edades de relativamente grandes poblaciones de personas.

12voto

Binarytales Puntos 1145

Aquí está mi respuesta publicado por primera vez en las matemáticas.stackexchange:

La mediana es lo que muchas personas tienen en mente cuando dicen "decir". Es más fácil interpretar la mediana: la mitad de la población está por encima de esta edad y la otra mitad está por debajo. Significa que es un poco más sutil.

La gente busca la simetría y, a veces, imponer la simetría cuando no está allí. La distribución por edades de una población está lejos de ser simétrico, por lo que la media podría ser engañosa. Distribución de la edad es algo así como una pirámide. Muchos de los niños, no muchas personas de edad avanzada. (O al menos eso es lo que es en una especie de estado estacionario. En los estados unidos, la post-segunda guerra mundial, la generación del baby boom se ha distorsionado esta distribución de la edad. Algunas personas han llamado a esto "el cuadrado de la pirámide", porque los "baby boomers" han hecho de la parte superior de la pirámide más amplia de lo que ha sido en el pasado.)

Con una distribución asimétrica, puede ser mejor para el informe de la mediana porque es simétrica estadística. La mediana es simétrica, incluso si la distribución de muestreo no lo es.

7voto

¿Por qué es mejor que un hacha un hacha?

Es similar a tu pregunta. Sólo decir y hacer cosas diferentes. Si uno está hablando de medias entonces la historia que intentan transmitir, el modelo que intentan aplicar a los datos, es diferente a uno con los medios.

3voto

Alan Puntos 7273

No creo que hay una buena descriptivo motivo de la elección de la mediana de más de media para la distribución de la edad. Hay uno de practicidad al comparar los datos notificados.

Muchos de los países informan de su población de 5 años de edad con un intervalo de la banda superior de composición abierta. Esto provoca algunas dificultades en el cálculo de la media de los intervalos, especialmente para los más pequeños de intervalo (afectados por las tasas de mortalidad infantil), la parte superior "intervalo" (¿cuál es la media de una 80+ "intervalo"?), y la cerca de la parte superior de los intervalos (la media de cada intervalo es por lo general inferior a la media).

Es mucho más fácil calcular la mediana por interpolación dentro del intervalo mediano, a menudo aproximación suponiendo un plano o trapecio distribución de edad en ese intervalo (tasas de mortalidad en muchos países son relativamente bajos alrededor de la mediana edad, haciendo de esta una más razonable aproximación de lo que es para los jóvenes o de edad).

2voto

kyle Puntos 274

Usted está consiguiendo buenas respuestas aquí, pero permítanme añadir a mis 2 centavos. Yo trabajo en pharmacometrics, que se ocupa en cosas como el volumen de la sangre, la velocidad de eliminación, a nivel de la base del efecto de la droga, el máximo efecto de la droga, y parámetros como la que.

Hacemos una distinción entre variables que pueden tomar cualquier valor en más o en menos, frente a los valores que sólo puede ser positivo. Un ejemplo de una variable que puede tomar cualquier valor, más o menos, sería efecto de la droga, que puede ser positivo, cero o negativo. Un ejemplo de una variable que sólo puede realmente positivo es el volumen de la sangre o de la droga de la velocidad de eliminación.

El modelo de estas cosas con las distribuciones que son por lo general ya sea normal o lognormal, normal para cualquier tipo de valores, y lognormal para el solo-positivas. Una lognormal número es el número E tomado a la energía de una distribución normal número, y es por eso que sólo puede ser positivo.

Para una distribución normal de la variable, la mediana, la media y la moda son el mismo número, así que no importa lo que usted usa. Sin embargo, para un lognormally variable de distribución, la media es mayor que la mediana y el modo, por lo que no es realmente muy útil. De hecho, la mediana es donde el normal subyacente tiene su media, por lo que resulta mucho más atractivo medida.

Desde la edad de (probablemente) nunca puede ser negativo, una distribución lognormal es probablemente una mejor descripción de lo normal, por lo que la mediana (E a la media de la normal subyacente) es más útil.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: