213 votos

¿Por qué un 95% CI no implica un 95% de probabilidad de que contenga la media?

Parece que a través de diversas preguntas relacionadas con aquí, hay consenso en que el "95%" parte de lo que llamamos un "intervalo de confianza 95%" se refiere al hecho de que si tuviéramos que replican exactamente nuestro muestreo y CI-cálculo de los procedimientos muchas veces, el 95% de esta manera calculada CIs contendría la media de población. También parece ser el consenso de que esta definición no permite concluir, a partir de un solo IC del 95% que existe un 95% de probabilidad de que la media de la cae en algún lugar dentro de la CI. Sin embargo, no entiendo cómo el anterior no implica que el último en la medida en que, de haber imaginado muchas CIs 95% de los cuales contienen la media de población, no nuestra incertidumbre con respecto a si realmente calculados CI contiene la media de la población es o no) que nos obligan a utilizar la base de la tasa de la imaginaba de los casos (95%) como la estimación de la probabilidad de que nuestro caso real contiene el CI?

He visto puestos de argumentar a lo largo de las líneas de "la realidad-computa CI contiene la media de la población es o no, por lo que su probabilidad es 1 o 0", pero esto parece implicar una extraña definición de probabilidad que depende de los estados desconocidos (es decir, un amigo voltea la moneda, se esconde el resultado, y yo soy rechazado de decir que hay un 50% de probabilidad de que los jefes).

Seguramente estoy equivocado, pero no veo donde está mi lógica ha ido mal...

12voto

John Richardson Puntos 1197

Parte del problema es que la definición frecuentista de probabilidad de no permitir que un trivial de probabilidad para ser aplicado a los resultados de un experimento en particular, pero sólo para algunos ficticia población de experimentos a partir de la cual este experimento en particular puede ser considerada como un ejemplo. La definición de un CI es confuso, ya que es una declaración acerca de esto (por lo general) de la ficticia población de experimentos, en lugar de sobre el particular, los datos recogidos en la instancia en la mano. Por lo tanto, parte de la cuestión es la de la definición de probabilidad: La idea de que el verdadero valor se encuentren dentro de un determinado intervalo con una probabilidad de 95% es incompatible con un frecuentista marco.

Otro aspecto de la cuestión es que el cálculo de la frecuentista de la confianza de no utilizar toda la información contenida en la muestra particular relevante para la delimitación de la verdad el valor de la estadística. Mi pregunta "¿hay algún ejemplo donde los intervalos de credibilidad Bayesianos son evidentemente inferiores a frecuencial de los intervalos de confianza" describe un artículo de Edwin Jaynes que tiene unos muy buenos ejemplos de que realmente ponen de relieve la diferencia entre los intervalos de confianza e intervalos de credibilidad. Uno que es particularmente relevante para esta discusión es el Ejemplo 5, en el que se explica la diferencia entre un fiable y un intervalo de confianza para estimar el parámetro de una distribución exponencial truncada (por un problema en el control de calidad industrial). En el ejemplo que da, hay suficiente información en la muestra a ser cierto que el verdadero valor del parámetro se encuentra en ninguna parte en un bien construidos, 90% intervalo de confianza!

Esto puede parecer chocante para algunos, pero la razón de este resultado es que los intervalos de confianza e intervalos de credibilidad son las respuestas a dos preguntas diferentes, a partir de dos diferentes interpretaciones de la probabilidad.

El intervalo de confianza es la respuesta a la solicitud: "me da un intervalo que soporte el verdadero valor del parámetro en 0p$% of the instances of an experiment that is repeated a large number of times." The credible interval is an answer to the request: "Give me an interval that brackets the true value with probability $p$ dada la particular de la muestra de hecho, he observado." Para ser capaz de responder a la última petición, primero debemos adoptar, ya sea (a) un nuevo concepto de los datos de proceso de generación o (b) un concepto diferente de la definición de probabilidad de sí mismo.

La razón principal de que cualquier particular, 95% intervalo de confianza no implica un 95% de probabilidad de que contenga la media es debido a que el intervalo de confianza es una respuesta a una pregunta diferente, por lo que sólo es la respuesta correcta cuando la respuesta a las dos preguntas que pasa a tener la misma solución numérica.

En resumen, creíble y los intervalos de confianza responder a diferentes preguntas desde diferentes perspectivas; ambos son útiles, pero hay que elegir el intervalo para la pregunta que usted quiere pedir. Si desea un intervalo que admite una interpretación de un 95% (posterior) de probabilidad de que contenga el verdadero valor, a continuación, seleccione un intervalo creíble (y, con ella, el operador de la conceptualización de la probabilidad), no un intervalo de confianza. Lo que no debemos hacer es adoptar una definición diferente de la probabilidad en la interpretación que la que se usa en el análisis.

Gracias a @cardenal por sus mejoras!

10voto

Michael Chapman Puntos 148

Estoy sorprendido de que nadie se ha planteado de Berger ejemplo de una esencialmente inútil 75% intervalo de confianza se describe en el segundo capítulo de "La Probabilidad de Principio". Los detalles pueden ser encontrados en el texto original (que está disponible de forma gratuita en el Proyecto de Euclides): lo esencial sobre el ejemplo es el que se describe, de forma inequívoca, una situación en la que usted sabe con absoluta certeza el valor de una apariencia parámetro desconocido después de observar los datos, pero se podría afirmar que solo el 75% de confianza de que su intervalo contiene el valor verdadero. Trabajando a través de los detalles de ese ejemplo fue lo que me permitió comprender en su totalidad la lógica de la construcción de intervalos de confianza.

4voto

Las probabilidades relacionadas con la teórica largo plazo de los eventos, que trabajar incluso si ejecuta los eventos en el largo plazo, simplemente no se refieren a un solo evento después de que se hace. Y la ejecución de un experimento y cálculo de la CI es tan sólo un evento.

Usted querido comparar a la probabilidad de que un oculto moneda cabezas.. tal vez puedo trabajar con eso. Vamos a ver si me puede completamente el tornillo esta pegado a la analogía.

Al ejecutar el experimento y recoger sus datos, usted tiene algo similar a la actual cara de la moneda. El proceso del experimento es como el proceso de voltear la moneda en que se genera $\mu$ or it doesn't just like the coin is heads or it's not. Once you flip the coin, whether you see it or not, there is no probability that it's heads, it's either heads or it's not. Now suppose you call heads. That's what calculating the CI is. Because you can't ever reveal the coin (your analogy to an experiment would vanish). Either you're right or you're wrong, that's it. Does it's current state have any relation to the probability of it coming up heads on the next flip, or that I could have predicted what it is? No. The process by which the head is produced has a 0.5 probability of producing them but it does not mean that a head that already exists has a 0.5 probability of being. Once you calculate your CI there is no probability that it captures $\mu$, se realiza o no-que ya ha volteado la moneda.

OK, creo que me he torturado que suficiente. El punto crítico es realmente que tu analogía es errónea. Usted no puede revelar la moneda, sólo puede llamar a cara o cruz, basándose en suposiciones acerca de las monedas (experimentos). Es posible que desee realizar una apuesta después sobre sus cabezas o colas de ser correcta, pero nunca se pueden cobrar.

Probablemente, lo que hace que el CI confuso es el nombre. Es un rango de valores que hacer o no contener $\mu$. We think they likely contain $\mu$ but the probability of that isn't the same as the process that went into developing it. The 95% part of the 95% CI name is just about the process. You can calculate a range that you believe afterwards contains $\mu$ en algún nivel de probabilidad, pero eso es un cálculo diferentes y no un CI.

Es mejor pensar en el nombre IC del 95% como denominación de un tipo de medida de un intervalo de valores que usted piensa que es factible que contienen $\mu$ and separate the 95% from that plausibility. We could call it the Jennifer CI while the 99% CI is the Wendy CI. That might actually be better. Then, afterwards we can say that we believe $\mu$ is likely to be in the range of values and no one would get stuck saying that there is a Wendy probability that we've captured $\mu$. Si te gustaría tener una diferente designación creo que probablemente, usted debe sentirse libre para deshacerse de la "confianza" por parte de CI (pero es un intervalo).

4voto

Sean Hanley Puntos 2428

Formal, explícito ideas acerca de los argumentos, la inferencia y la lógica se originó, dentro de la tradición Occidental, con Aristóteles. Aristóteles escribió sobre estos temas en varias obras (incluyendo una que se llama los Temas ;-) ). Sin embargo, el más básico principio único es la Ley de La No contradicción, que se puede encontrar en varios lugares, incluyendo la Metafísica, libro IV, capítulos 3 y 4. Una formulación típica es: "...es imposible para cualquier cosa, al mismo tiempo, el ser y el no ser [en el mismo sentido]" (1006 1). Su importancia está dicho un poco antes, "...esto es, naturalmente, el punto de partida para todos los otros axiomas" (1005 b 30). Perdóname por depilación con cera filosófica, pero esta cuestión, por su naturaleza, tiene contenido filosófico que simplemente no puede ser dejada de lado por conveniencia.

Considere la posibilidad de este experimento mental: Alex tira una moneda, lo atrapa y lo convierte en su antebrazo con la mano cubriendo la cara hacia arriba. Bob estaba en la posición correcta; él brevemente vio la moneda en la de Alex de la mano, y por lo tanto se puede deducir de qué lado se enfrenta a hasta ahora. Sin embargo, Carlos no ver la moneda, pero no estaba en el lugar correcto. En este punto, Alex les pregunta ¿cuál es la probabilidad de que la moneda muestra jefes. Carlos sugiere que la probabilidad es de .5, ya que es el tiempo-frecuencia de ejecución de las cabezas. Bob no está de acuerdo, él con confianza afirma que la probabilidad no es otra cosa sino exactamente 0.

Ahora, ¿quién tiene razón? Es posible, por supuesto, de que Bob mal visto y es incorrecta (supongamos que él no mal ver). Sin embargo, no se puede sostener que ambos son de la derecha y mantener a la ley de la no contradicción. (Supongo que si no crees en la ley de la no contradicción, usted podría pensar que está a la derecha, o algún tipo de formulación.) Ahora imaginemos un caso similar, pero sin Bob presentes, podrían Carlos sugerencia estar más a la derecha (eh?) sin Bob, ya que nadie vio la moneda? La aplicación de la ley de la no contradicción no es tan clara en este caso, pero creo que es obvio que las partes de la situación que parecen ser importantes se mantienen constantes desde el primero al último. Ha habido muchos intentos de definir la probabilidad, y en el futuro puede todavía ser muchos más, pero una definición de la probabilidad como una función de la que pasa a ser de pie alrededor y de donde pasan a colocarse tiene poco atractivo. En cualquier caso (adivinar por su uso de la frase "la confianza del intervalo"), estamos trabajando en el enfoque Frecuentista, y de la misma si alguien sabe el verdadero estado de la moneda es irrelevante. No es una variable aleatoria, es un valor obtenido y, o bien se muestra jefes, o muestra colas.

Como @John notas, el estado de una moneda no puede, en principio, parecen similares a la cuestión de si un intervalo de confianza cubre la verdadera media. Sin embargo, en lugar de una moneda, podemos entender esto de manera abstracta como un valor obtenido extraída de una distribución de Bernoulli con parámetro de $p$. In the coin situation, $p=.5$, whereas for a 95% CI, $p=.95$. What's important to realize in making the connection is that the important part of the metaphor isn't the $p$ que rige la situación, sino que el volteado de la moneda o el calculado CI es un di cuenta de valor, no una variable aleatoria.

Para mí es importante señalar en este punto que todo esto es el caso dentro de una concepción Frecuencial de la probabilidad. La perspectiva Bayesiana no viola la ley de la no contradicción, simplemente comienza a partir de diferentes suposiciones metafísicas acerca de la naturaleza de la realidad (más específicamente acerca de la probabilidad). Otros en la CV son mucho mejor versado en el Bayesiano perspectiva de lo que soy, y tal vez se puede explicar por qué los supuestos detrás de su pregunta no se aplican en el enfoque Bayesiano, y que, de hecho, bien puede ser una probabilidad del 95% de la media situada en un 95% creíble intervalo, bajo ciertas condiciones, incluyendo (entre otros) que el estado utilizó fue precisa (véase el comentario de @DikranMarsupial a continuación). Sin embargo, creo que todos estaríamos de acuerdo en que una vez que el estado está trabajando en el enfoque Frecuentista, no puede ser el caso de que la probabilidad de que la verdadera media de la mentira en cualquiera de 95% CI es .95.

4voto

Michael Kropat Puntos 3993

Mientras que ha habido un extenso debate en los numerosos grandes respuestas, quiero añadir una más simple perspectiva. (aunque se ha aludido en otras respuestas, pero no de forma explícita.) Para algunos el parámetro $\theta$, and given a sample $(X_1,X_2,\cdots,X_n)$, a 0p\%$ intervalo de confianza para una probabilidad de instrucción de la forma

$$P\left(g(X_1,X_2,\cdots,X_n)<\theta<f(X_1,X_2,\cdots,X_n)\right)=p$$

Si tenemos en cuenta $\theta$ to be a constant, then the above statement is about the random variables $g(X_1,X_2,\cdots,X_n)$ and $f(X_1,X_2,\cdots,X_n)$, or more accurately, it is about the random interval $\left(g(X_1,X_2,\cdots,X_n),f(X_1,X_2,\cdots,X_n)\right)$.

Así que en lugar de dar toda la información acerca de la probabilidad de que el parámetro que está contenida en el intervalo, es dar información acerca de la probabilidad de que el intervalo contenga el parámetro - como el intervalo se hace a partir de las variables aleatorias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: