16 votos

Estadística suficiente, problemas específicos/intuición

Estoy aprendiendo algunas estadísticas para la diversión y tengo un poco de confusión con respecto a las estadísticas suficientes. Voy a escribir mis confusiones en formato de lista:

  1. Si una distribución tiene $n$ parámetros, se han $n$ de suficientes estadísticas?

  2. ¿Hay algún tipo de correspondencia directa entre los suficientes estadísticas y los parámetros? O hacer el suficiente estadísticas sólo sirven como una fuente de "información", de modo que podamos volver a crear la configuración de manera que podemos calcular las mismas estimaciones para los parámetros de la distribución subyacente.

  3. Hacer todas las distribuciones tienen suficientes estadísticas? es decir. puede el teorema de la factorización de fallar?

  4. El uso de nuestra muestra de datos, se asume una distribución de los datos es más probable que se de y, a continuación, puede calcular las estimaciones (por ejemplo, el MLE) para los parámetros de la distribución. De suficientes estadísticas son una manera de ser capaz de calcular las mismas estimaciones para los parámetros sin tener que depender de los datos en sí, ¿verdad?

  5. Todos los conjuntos de suficientes estadísticas tienen un mínimo suficiente de la estadística?

Este es el material que estoy utilizando para tratar de entender el tema en cuestión: https://onlinecourses.science.psu.edu/stat414/node/283

Por lo que entiendo que tenemos un teorema de la factorización de la que la separa de la distribución conjunta en dos funciones, pero no entiendo cómo somos capaces de extraer la suficiente estadística después de factorización de la distribución dentro de nuestras funciones.

  1. La distribución de Poisson pregunta, dado que en este ejemplo tiene un claro factorización, pero luego se dijo que el suficiente estadísticas de la media muestral y la muestra de la suma. ¿Cómo sabemos que esos fueron los suficientes estadísticas con sólo mirar la forma de la primera ecuación?

  2. Cómo es posible llevar a cabo la misma MLE estimaciones obtenidas a partir de las estadísticas suficientes si la segunda ecuación de la factorización resultado va a depender a veces de los valores de los datos $X_i$ a sí mismos? Por ejemplo, en el caso de Poisson la segunda función dependía de la inversa del producto de los factoriales de los datos, y nosotros ya no tenemos los datos!

  3. ¿Por qué el tamaño de la muestra $n$ no será suficiente estadística, en relación a la distribución de Poisson ejemplo en la página web? Requeriríamos $n$ a reconstruir ciertas partes de la primera función, así que ¿por qué no es suficiente la estadística así?

1voto

jasonmray Puntos 1303

Probablemente se benefician de la lectura acerca de la suficiencia en cualquier libro de texto sobre el teórico de la estadística, donde la mayoría de estas cuestiones se tratarán en detalle. Brevemente ...

  1. No necesariamente. Esos son casos especiales: de distribuciones donde el soporte (el rango de valores de los datos puede tomar) no depende del parámetro desconocido(s), sólo aquellos en los exponencial de la familia tienen un suficiente estadística de la misma dimensionalidad que el número de parámetros. Así que para la estimación de la forma y la escala de la distribución de Weibull o la ubicación y la escala de una logística de distribución de observaciones independientes, con el fin de estadística (todo el conjunto de observaciones independientemente de su secuencia) es mínima suficiente—usted no puede reducirlo aún más, sin perder la información acerca de los parámetros. Donde el apoyo no depende del parámetro desconocido(s) varía: para una distribución uniforme en $(0,\theta)$, el ejemplo máximo es suficiente para $\theta$; para una distribución uniforme en $(\theta-1,\theta+1)$ de la muestra mínimo y máximo están juntos suficiente.

  2. No sé a qué te refieres por "correspondencia directa"; la alternativa que dé parece una manera justa para describir las estadísticas suficientes.

  3. Sí: trivialmente el conjunto de los datos son suficientes. (Si usted oye a alguien decir que no hay suficiente estadística que significa que no hay bajas dimensiones.)

  4. Sí, esa es la idea. (¿Qué es la izquierda la distribución de los datos condicional en el grado suficiente de estadística—puede ser utilizado para verificar la distribución de la asunción independientemente del parámetro desconocido(s).)

  5. Parece que no, aunque deduzco que la contra-ejemplos no son distribuciones que usted es probable que desee utilizar en la práctica. [Estaría bien si alguien pudiera explicar esto sin entrar demasiado en teoría de la medida.]

En respuesta a las preguntas más ...

  1. El primer factor, $ \mathrm{e}^{-n\lambda}\cdot\lambda^{\sum{x_i}}$, depende de $\lambda$ sólo a través de la $\sum x_i$. Así que cualquier uno-a-uno de la función de $\sum x_i$ es suficiente: $\sum x_i$, $\sum x_i/n$, $(\sum x_i)^2$, y así sucesivamente.

  2. El segundo factor, $\tfrac{1}{x_1! x_2! \ldots x_n!}$, no depende de la $\lambda$ & de modo que no afecten el valor de $\lambda$ a que $f(x;\lambda)$ es un máximo. Se derivan de la MLE y ver por ti mismo.

  3. El tamaño de la muestra $n$ es una constante en lugar de un valor obtenido de una variable aleatoria, por lo que no se considera parte de la estadística suficiente; lo mismo para los parámetros conocidos distinta a las que se desea inferir cosas acerca de.

† En este caso el cuadrado es uno-a-uno, porque $\sum x_i$ es siempre positivo.

‡ Al $n$ es un valor obtenido de la variable aleatoria $N$, pasará a ser parte de la estadística suficiente, $(\sum x_i,n)$. Digamos que usted elija un tamaño de muestra de 10 o 100 por lanzar una moneda: $n$ dice nada sobre el valor de $\theta$, pero sí afecta a la precisión con que se puede estimar que, en este caso se llama un auxiliar complemento a $\sum x_i$ & inferencia puede proceder acondicionado en su di cuenta de valor—en efecto, ignorando que podría haber llegado a cabo diferentes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X