39 votos

Cómo interpretar F y p-valor en ANOVA?

Soy nuevo en estadísticas y actualmente lidiar con ANOVA. Se llevo a cabo una prueba de ANOVA en R usando

aov(dependendVar ~ IndependendVar)

Puedo conseguir – entre otras – F-valor y un p-valor.

Mi hipótesis nula ($H_0$) es que todas las medias de los grupos son iguales.

Hay una gran cantidad de información disponible sobre cómo la F se calcula, pero no sé cómo leer un estadístico F y cómo la F y p están conectados.

Así que, mis preguntas son:

  1. ¿Cómo puedo determinar la crítica F-valor para rechazar $H_0$?
  2. ¿Cada F tiene un correspondiente valor de p, por lo que ambos significan básicamente lo mismo? (por ejemplo, si $p<0.05$, $H_0$ es rechazado)

28voto

Eero Puntos 1612

La estadística F es un cociente de 2 maneras diferentes de medir de la varianza para los datos. Si la hipótesis nula es verdadera, entonces ambos son estimaciones de lo mismo y la relación será de alrededor de 1.

El numerador se calcula mediante la medición de la varianza de los medios y si el verdadero medio de los grupos son idénticas, este es una función de la varianza global de los datos. Pero si la hipótesis nula es falsa y los medios no son todos iguales, entonces esta medida de la varianza será más grande.

El denominador es un promedio de la muestra las desviaciones de cada grupo, que es una estimación del total de la varianza de la población (suponiendo que todos los grupos tengan igualdad de varianzas).

Así que cuando la anulación de todos los medios de que la igualdad es cierto, entonces las 2 medidas (con algunos de los términos adicionales para los grados de libertad) serán similares y la relación será de cerca de 1. Si la nula es falsa, entonces el numerador será grande en relación con el denominador y el cociente será mayor que 1. Mirando esta relación en el F de tabla (o de la computación con una función como pf en R) dará el p-valor.

Si usted prefiere usar un rechazo a la región de un p-valor, entonces usted puede utilizar el F de la tabla o la qf función en R (u otro software). La distribución F tiene 2 tipos de grados de libertad. El numerador y grados de libertad se basa en el número de grupos que se están comparando (1-way es el número de grupos menos 1) y el denominador grados de libertad se basa en el número de observaciones dentro de los grupos (1-way es el número de observaciones menos el número de grupos). Para obtener más complicado de los modelos de los grados de libertad conseguir más complicado, pero siga ideas similares.

20voto

Alfred Puntos 9

La mejor manera de pensar acerca de la relación entre $F$, $p$, y el valor crítico es con una imagen:

enter image description here

La curva de aquí es una $F$ de la distribución, esto es, la distribución de $F$ estadísticas que nos gustaría ver si la hipótesis nula fuera cierta. En este diagrama, la observación de la $F$ estadística es la distancia desde el negro línea discontinua para el eje vertical. El $p$ valor es el azul oscuro, el área bajo la curva de $F$ hasta el infinito. Observe que cada valor de $F$ debe corresponder a un único $p$ valor, y de que el mayor $F$ valores corresponden a menor $p$ valores.

Usted debe notar un par de cosas acerca de la distribución bajo la hipótesis nula:

1) $F$ valores aproximándose a cero son altamente improbable (esto no es siempre cierto, pero es cierto que para la curva en este ejemplo)

2) Después de un cierto punto, el más grande de la $F$, menor es la probabilidad de. (La curva se va desvaneciendo hacia la derecha.)

El valor crítico $C$ también hace una aparición en este diagrama. El área bajo la curva de $C$ a infinito es igual al nivel de significación (aquí, el 5%). Se puede decir que el $F$ estadística de aquí resultaría en un error al rechazar la hipótesis nula debido a que es menos de $C$, es decir, su $p$ valor es mayor que .05. En este ejemplo específico, $p=0.175$, pero necesitarías una regla para calcular que la mano :-)

Tenga en cuenta que la forma de la $F$ distribución depende de sus grados de libertad, que para el ANOVA se corresponden con el número de grupos (menos 1) y el número de observaciones menos el número de grupos). En general, en general, la "forma" de la $F$ curva está determinada por el primer número, y su "planitud" está determinado por el segundo número. El ejemplo anterior tiene un $df_1 = 3$ (4 grupos), pero vas a ver que la configuración de $df_1 = 2$ (3 grupos) se traduce en una marcada curva distinta:

enter image description here

Puedes ver otras variantes de la curva en el Señor la Página de Wikipedia. Una cosa que cabe destacar es que debido a que el $F$ estadística es una relación, un gran número son poco comunes bajo la hipótesis nula, incluso con grandes grados de libertad. Esto es en contraste a $\chi^2$ estadísticas, que no se dividen por el número de grupos, y, esencialmente, crecer con los grados de libertad. (De lo contrario $\chi^2$ es análoga a $F$ en el sentido de que $\chi^2$ se deriva de una distribución normal, $z$ los resultados, mientras que $F$ se deriva de $t$-distribuidas $t$ statistics).

Eso es mucho más de lo que yo significaba para escribir, pero espero que cubre sus preguntas!

(Si usted se está preguntando dónde los diagramas de vino, que fueron generados automáticamente por mi escritorio paquete de estadísticas, Asistente.)

13voto

Chris Conway Puntos 6678

Para responder a tus preguntas:

  1. Encontrar el valor F crítico a partir de una distribución F (aquí una tabla). Ver un ejemplo. Tienes que ser cuidadoso acerca de una manera y no de dos vías, los grados de libertad del numerador y del denominador.

  2. Sí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: