34 votos

Interpretación del valor p en la prueba de hipótesis

Recientemente me encontré con el papel de "la Insignificancia de La Hipótesis Nula Pruebas de Significación", Jeff Gill (1999). El autor planteaba algunos conceptos erróneos comunes acerca de la prueba de hipótesis y los valores de p, acerca de la cual tengo dos preguntas específicas:

  1. El p-valor es técnicamente $P({\rm observación}|H_{0})$, que, como se señaló en el documento, por lo general no nos dicen nada acerca de $P(H_{0}|{\rm observación})$, a menos que suceda a conocer las distribuciones marginales, que rara vez es el caso en el "diario" de pruebas de hipótesis. Cuando recibimos un pequeño p-valor y "rechazar la hipótesis nula," ¿qué es exactamente la probabilística de la declaración que estamos haciendo, ya que no podemos decir nada acerca de $P(H_{0}|{\rm observación})$?
  2. La segunda cuestión se refiere a una declaración en particular a partir de la página 6(652) de la ponencia:

Puesto que el p-valor o rango de valores de p se indica por las estrellas, no se establece a priori, no es el largo plazo, la probabilidad de cometer un error de Tipo I, pero generalmente es tratada como tal.

Alguien puede ayudar a explicar lo que significa esta afirmación?

10voto

Sean Hanley Puntos 2428

+1 a @MichaelLew, que ha proporcionado una buena respuesta. Quizás pueda contribuir al proporcionar una manera de pensar acerca de la Q2. Considere la situación siguiente:

  • La hipótesis nula es verdadera. (Tenga en cuenta que si la hipótesis nula es la no verdad, no los errores de tipo I son posibles, y no está claro cuál es el significado que el $p$-valor ha.)
  • $\alpha$ se ha establecido convencionalmente en $0.05$.
  • La calculada $p$-valor es de $0.01$.

Ahora bien, la probabilidad de obtener los datos de como extremo o más extremo que el de tus datos es de 1% (que es lo que el $p$-valor medio). Ha rechazado la hipótesis nula, haciendo un error de tipo I. Es cierto que el largo plazo el tipo de la tasa de error en esta situación es también un 1%, lo que muchas personas podrían intuitivamente concluir? La respuesta es no. La razón es que si se había conseguido un $p$-valor de $0.02$, usted todavía tiene rechaza la nula. De hecho, usted hubiera rechazado null incluso si $p$ había $0.04\bar{9}$, y en el largo plazo, $p$'s de esta gran ocurrirá $\aprox$5% del tiempo y todos esos rechazos serán los errores de tipo I. Por lo tanto, en el largo plazo el tipo de la tasa de error es del 5% (donde se había establecido $\alpha$).

(Revelación: no he leído Gill de papel, así que no puedo garantizar que esto es lo que quería decir, pero hacen que el sentido de la afirmación de que el $p$-valor no es [necesariamente] el mismo que el largo plazo el tipo de error rate).

8voto

Ηλίας Puntos 109

Me gustaría hacer un comentario sobre "la insignificancia de la hipótesis nula pruebas de significación", pero que no responde a la pregunta del OP.

En mi opinión, el problema principal no es la interpretación de los $p$-valor. Muchos practicantes a menudo de prueba para una "diferencia significativa", por ejemplo, y que creen, equivocadamente, que una diferencia significativa significa que hay una "gran diferencia". Más precisamente, en el contexto de una "precisa" hipótesis nula de $H_0$ tener forma $H_0\colon\{\theta=0\}$. Esta hipótesis será rechazado cuando $\theta=\epsilon$ incluso para un muy pequeño $\epsilon$ cuando el tamaño de la muestra aumenta. Pero en el mundo real, no hay ninguna diferencia entre un pequeño $\epsilon$ y $0$ (decimos que no hay equivalencia entre un pequeño $\epsilon$ y $0$ y equivalencia de pruebas es el camino a seguir en una situación así).

4voto

Auron Puntos 2123

(Técnicamente, el valor P es la probabilidad de observar los datos de al menos tan extremo como el que realmente observada, dado que la hipótesis nula.)

Q1. La decisión de rechazar la hipótesis nula sobre la base de un pequeño P-valor normalmente depende 'de Fisher disyunción': un raro evento que ha sucedido o si la hipótesis nula es falsa. En efecto, es la rareza del evento es lo que el P-valor indica más bien que la probabilidad de que la nula es falsa.

La probabilidad de que el valor null es falso puede ser obtenido a partir de los datos experimentales solamente por medio del teorema de Bayes, el cual requiere la especificación de la 'previa' de la probabilidad de la hipótesis nula (es de suponer que lo que Gill se refiere como "distribuciones marginales").

Q2. Esta parte de tu pregunta es mucho más difícil de lo que podría parecer. Hay una gran confusión con respecto a los valores de P y de las tasas de error que es, presumiblemente, lo que Gill se refiere con "pero generalmente es tratada como tal." La combinación de Fisherian los valores de P con Neyman-Pearsonian las tasas de error que se ha llamado una mezcla incoherente, y es por desgracia muy extendida. No hay respuesta corta es que va a ser completamente adecuado aquí, pero puedo señalar que un par de buenos artículos (sí, uno es mío). Ambos le ayudarán a dar sentido a las Branquias de papel.

Hurlbert, S., & Lombardi, C. (2009). Colapso Final de la Neyman-Pearson decisión marco teórico y el ascenso de la neoFisherian. Annales Zoologici Fennici, 46(5), 311-349. (Enlace al documento)

Lew, M. J. (2012). La mala práctica de la estadística en farmacología (y otras disciplinas biomédicas): usted probablemente no sabe P. British Journal of Pharmacology, 166(5), 1559-1567. doi:10.1111/j.1476-5381.2012.01931.x (Enlace al documento)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: