15 votos

Definición de la familia de una distribución?

Hace una familia de una distribución de tener una definición diferente para las estadísticas que en otras disciplinas?

En general, una familia de curvas es un conjunto de curvas, cada una de las cuales está dada por una función o parametrización en el que uno o más de los parámetros es muy variada. Estas familias son utilizados, por ejemplo, para caracterizar los componentes electrónicos.

Para las estadísticas, una familia de acuerdo a una fuente, es el resultado de la variación de la forma de parámetros. Entonces, ¿cómo podemos comprender que la distribución gamma tiene una forma y parámetro de escala y sólo la generalización de la distribución gamma tiene, además, un parámetro de localización? ¿Que hacer de la familia el resultado de variaciones en el parámetro de localización? De acuerdo con @whuber el significado de una familia es, implícitamente, Una "parametrización" de una familia es un mapa continuo a partir de un subconjunto de ℝ$^n$, con su habitual topología, en el espacio de las distribuciones, cuya imagen es la de la familia.

Lo que, en lenguaje simple, es una familia de distribuciones estadísticas?

Una pregunta acerca de las relaciones entre las propiedades estadísticas de las distribuciones de la misma familia que ya ha generado una gran controversia por una cuestión diferente así que parece que merece la pena explorar el significado.

Que esto no es necesariamente una simple pregunta nace por su uso en la frase exponencial de la familia, que no tiene nada que ver con una familia de curvas, sino que está relacionado con el cambio de la forma del PDF de una distribución por volver a parametrizar, no sólo de los parámetros, sino también la sustitución de funciones de variables aleatorias independientes.

15voto

jldugger Puntos 7490

La estadística, las matemáticas y los conceptos son exactamente los mismos, la comprensión de que la "familia" es un genérico término matemático con variantes técnicas de adaptarse a diferentes circunstancias:

Paramétrico de la familia es una curva (o de la superficie o de otro finito-dimensional de la generalización de los mismos) en el espacio de todas las distribuciones.

El resto de este post explica lo que significa. Como un aparte, no creo que nada de esto es controvertido, ya sea matemática o estadísticamente (aparte de un tema menor, lo que se indica a continuación). En apoyo de esta opinión me ha proporcionado muchas referencias (sobre todo en los artículos de Wikipedia).


Esta terminología de "familias" tiende a ser utilizado a la hora de estudiar las clases de $\mathcal C_Y$ de las funciones en un conjunto $Y$ o "maps". Dado un dominio $X$, una familia $\mathcal F$ de los mapas en $X$ parametrizada por algunos de $\Theta$ ("parámetros") es una función

$$\mathcal F : X\times \Theta\to Y$$

para que (1) para cada una de las $\theta\in\Theta$, la función de $\mathcal{F}_\theta:X\to Y$ $\mathcal{F}_\theta(x)=\mathcal{F}(x,\theta)$ $\mathcal{C}_Y$ y (2) $\mathcal F$ sí tiene ciertos "bonita" de propiedades.

La idea es que queremos variar las funciones de $X$ $Y$en una "suave" o de manera controlada. De la propiedad (1) significa que cada una de las $\theta$ designa una función de este tipo, mientras que los detalles de la propiedad (2) se captura el sentido en el que un "pequeño" cambio en $\theta$ induce una lo suficientemente "pequeño" cambio en $\mathcal{F}_\theta$.

Un estándar de matemáticas ejemplo, cerca de lo que se menciona en la pregunta, es un homotopy. En este caso, $\mathcal{C}_Y$ es la categoría de continuo mapas de espacios topológicos $X$ en el espacio topológico $Y$; $\Theta=[0,1]\subset\mathbb{R}$ es la unidad de intervalo de con su habitual topología, y requerimos que $\mathcal{F}$ ser un continuo mapa de la topológico producto $X \times \Theta$ a $Y$. Puede ser pensado como un "continuo de la deformación del mapa $\mathcal{F}_0$$\mathcal{F}_1$." Al $X=[0,1]$ es en sí mismo un intervalo, tales mapas son curvas en $Y$ y el homotopy es una deformación suave de una curva a otra.

Para aplicaciones estadísticas, $\mathcal{C}_Y$ es el conjunto de todas las distribuciones en $\mathbb{R}$ (o, en la práctica, en $\mathbb{R}^n$ algunos $n$, pero para mantener la exposición simple me voy a centrar en $n=1$). Podemos identificarla con el conjunto de todos los no-decreciente càdlàg funciones de $\mathbb{R}\to [0,1]$ donde el cierre de su gama incluye tanto $0$$1$: estas son las funciones de distribución acumulativa, o simplemente las funciones de distribución. Por lo tanto, $X=\mathbb R$$Y=[0,1]$.

Una familia de distribuciones es cualquier subconjunto de a $\mathcal{C}_Y$. Otro nombre para una familia es modelo estadístico. Se compone de todas las distribuciones que se supone rigen nuestras observaciones, pero no hay otra forma de saber que distribución es la real.

  • Una familia puede estar vacío.
  • $\mathcal{C}_Y$ sí es una familia.
  • Una familia puede constar de una sola distribución o sólo un número finito de ellos.

Estos conjunto abstracto de la teoría de las características son de relativamente poco interés o utilidad. Es sólo cuando consideramos adicionales (relevante) estructura matemática en $\mathcal{C}_Y$ que este concepto es útil. Pero, ¿qué propiedades de $\mathcal{C}_Y$ son de la estadística de interés? Algunos de los que aparecen con frecuencia son:

  1. $\mathcal{C}_Y$ es un conjunto convexo: dadas dos distribuciones ${F}, {G}\in \mathcal{C}_Y$, podemos formar la mezcla de distribución de $(1-t){F}+t{G}\in Y$ todos los $t\in[0,1]$. Este es un tipo de "homotopy" de$F$$G$.

  2. Grandes partes de $\mathcal{C}_Y$ apoyo de varios pseudo indicadores, como el de Kullback-Leibler divergencia o la estrecha relación de Fisher Información métrica.

  3. $\mathcal{C}_Y$ tiene una estructura aditiva: correspondiente a cualquiera de las dos distribuciones $F$ $G$ es la suma de los mismos, ${F}\star {G}$.

  4. $\mathcal{C}_Y$ admite muchas útil, funciones naturales, a menudo denominado "propiedades". Estos incluyen cualquier fijo cuantil (tales como la mediana), así como la cumulants.

  5. $\mathcal{C}_Y$ es un subconjunto de un espacio funcional. Como tal, hereda muchas de medidas útiles, tales como el sup norma ($L^\infty$ norma) dado por $$||F-G||_\infty = \sup_{x\in\mathbb{R}}|F(x)-G(x)|.$$

  6. Naturales acciones del grupo en $\mathbb R$ inducir acciones en $\mathcal{C}_Y$. Las acciones más comunes son traducciones $T_\mu:x \to x+\mu$ y escalamientos $S_\sigma:x\to x\sigma$ $\sigma\gt 0$ . El efecto que estas tienen sobre la distribución es el envío de $F$ a la distribución dada por $F^{\mu,\sigma}(x) = F((x-\mu)/\sigma)$. Estos llevan a los conceptos de ubicación a escala de las familias y sus generalizaciones. (Yo no proporcionan una referencia, porque extensas búsquedas en la Web suba una variedad de diferentes definiciones: aquí, al menos, puede ser un poco de controversia.)

Las propiedades de la materia depende de la estadística problema y en cómo va a analizar los datos. Abordar todas las variaciones sugeridas por las anteriores características tomaría demasiado espacio para este medio. Vamos a centrarnos en uno común importante de la aplicación.

Tomemos, por ejemplo, de Máxima Verosimilitud. En la mayoría de las aplicaciones que usted querrá ser capaz de utilizar el Cálculo para obtener una estimación. Para que esto funcione, usted debe ser capaz de "tomar derivados" en la familia.

(Técnico de lado: El modo habitual en que esto se logra es seleccionar un dominio $\Theta\subset \mathbb{R}^d$ $d\ge 0$ y especificar un continuo localmente invertible función de $p$ $\Theta$ a $\mathcal{C}_Y$. (Esto significa que por cada $\theta\in\Theta$ existe una bola de $B(\theta, \epsilon)$, $\epsilon\gt 0$ que $p\mid_{B(\theta,\epsilon)}: B(\theta,\epsilon)\cap \Theta \to \mathcal{C}_Y$ es uno-a-uno. En otras palabras, si alteramos $\theta$ por una lo suficientemente pequeña cantidad siempre vamos a tener una distribución diferente.))

En consecuencia, en la mayoría de los ML de aplicaciones que requieren que el $p$ ser continua (y esperemos que, en casi todas partes diferenciable) en el $\Theta$ componente. (Sin continuidad, lo que maximiza la probabilidad de que generalmente se convierte en un problema irresoluble.) Esto nos lleva a la siguiente probabilidad orientado a la definición de una paramétrica de la familia:

Paramétrico de la familia de (univariante) distribuciones es localmente invertible mapa $$\mathcal{F}:\mathbb{R}\times\Theta \to [0,1],$$ with $\Theta\subconjunto \mathbb{R}^n$, for which (a) each $\mathcal{F}_\theta$ is a distribution function and (b) for each $x\in\mathbb R$, the function $\mathcal{L}_x: \theta\a [0,1]$ given by $\mathcal{L}_x(\theta) = \mathcal{F}(x,\theta)$ es continua y en casi todas partes diferenciables.

Tenga en cuenta que una familia paramétrica de $\mathcal F$ es más que la colección de $\mathcal{F}_\theta$: también incluye el modo específico en que los valores de los parámetros $\theta$ corresponden a las distribuciones.

Vamos a terminar con algunos ejemplos ilustrativos.

  • Deje $\mathcal{C}_Y$ ser el conjunto de todas las distribuciones Normales.Como dado, esto es no paramétrico de la familia: es sólo una familia. Para ser paramétrico, tenemos que elegir una parametrización. Una forma es elija $\Theta = \{(\mu,\sigma)\in\mathbb{R}^2\mid \sigma \gt 0\}$ y a la mapa $(\mu,\sigma)$ a la distribución Normal con una media de $\mu$ y de la varianza $\sigma^2$.

  • El conjunto de Poisson$(\lambda)$ distribuciones es paramétrico de la familia con $\lambda\in\Theta=(0,\infty)\subset\mathbb{R}^1$.

  • El conjunto de Uniformes$(\theta, \theta+1)$ distribuciones (que cuenta con lugar destacado en muchos de los ejercicios del libro de texto) es un paramétrica de la familia con $\theta\in\mathbb{R}^1$. En este caso, $F_\theta(x) = \max(0, \min(1, x-\theta))$ is differentiable in $\theta$, excepto para $\theta\in\{x, x-1\}$.

  • Deje $F$ $G$ ser cualquiera de las dos distribuciones. A continuación, $\mathcal{F}(x,\theta)=(1-\theta)F(x)+\theta G(x)$ es paramétrico de la familia para $\theta\in[0,1]$. (Prueba: la imagen de $\mathcal F$ es un conjunto de distribuciones y su derivada parcial en $\theta$ es igual a $-F(x)+G(x)$, el cual es definido en todas partes.)

  • La prueba de Pearson de la familia es una de cuatro dimensiones de la familia, $\Theta\subset\mathbb{R}^4$, que incluye (entre otros) la Normalidad de las distribuciones, distribuciones Beta, y Gamma Inversa de las distribuciones. Esto ilustra el hecho de que una determinada distribución pueden pertenecer a diferentes distribución de las familias. Esto es perfectamente análoga a la observación de que cualquier punto en un (suficientemente grande) espacio puede pertenecer a muchos caminos que se cruzan allí. Esto, junto con la construcción anterior, nos muestra que la distribución no exclusiva determina una familia a la que pertenece.

  • La familia $\mathcal{C}_Y$ de todos los finitos de la varianza absolutamente continuas distribuciones no paramétricas. La prueba requiere de un profundo teorema de topología: si queremos dotar a $\mathcal{C}_Y$ con cualquier topología (si, estadísticamente, útil o no) e $p: \Theta\to\mathcal{C}_Y$ es continua y localmente tiene un continuo inversa, entonces localmente $\mathcal{C}_Y$ deben tener la misma dimensión que la de $\Theta$. Sin embargo, en todos estadísticamente significativos topologías, $\mathcal{C}_Y$ es infinito dimensional.

0voto

Hoogendijk Puntos 45

Gracias a @whuber hay información suficiente para resumir, en lo que espero sea un simple formulario en relación con la pregunta de que este post se levantó. "Otro nombre para una familia [Sic, de estadística de la familia] es [a] modelo estadístico."

A partir de esa entrada en la Wikipedia: Un modelo estadístico que consiste de todas las distribuciones que se supone rigen nuestras observaciones, pero no hay otra forma de saber que distribución es la real. Lo que distingue a un modelo estadístico a partir de otros modelos matemáticos es que un modelo estadístico no es determinista. Por lo tanto, en un modelo estadístico que se especifica a través de ecuaciones matemáticas, algunas de las variables no tienen valores específicos, pero en lugar de tener distribuciones de probabilidad; es decir, algunas de las variables son estocásticos. Un modelo estadístico es generalmente considerado como un par de $( S , P )$ donde $S$ es el conjunto de posibles observaciones, es decir, el espacio muestral, y $P$ es un conjunto de distribuciones de probabilidad en $S$.

Supongamos que tenemos un modelo estadístico $(S, \mathcal{P})$$\mathcal{P}=\{P_{\theta} : \theta \in \Theta\}$. El modelo se dice que es un modelo Paramétrico si $\Theta$ tiene una dimensión finita. En la notación, podemos escribir que $\Theta \subseteq \mathbb{R}^d$ donde $d$ es un número entero positivo ($\mathbb{R}$ indica que los números reales; otros conjuntos puede ser utilizado, en principio). Aquí, $d$ se llama la dimensión de la modelo.

Como un ejemplo, si suponemos que los datos surgen de un univariante de la distribución Gaussiana, entonces estamos asumiendo que
$$\mathcal{P}=\left\{P_{\mu,\sigma }(x) \equiv \frac{1}{\sqrt{2 \pi} \sigma} \exp\left( -\frac{(x-\mu)^2}{2\sigma^2}\right) : \mu \in \mathbb{R}, \sigma > 0 \right\}. $$ En este ejemplo, la dimensión, $d$ es igual a 2, fin de la cita.

Por lo tanto, si queremos reducir la dimensionalidad mediante la asignación, para el ejemplo de arriba, $\mu=0$, podemos mostrar a una familia de curvas del trazado $\sigma=1,2,3,4,5$ o en cualquier elección para $\sigma$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X