403 votos

¿Qué es la intuición detrás de la distribución beta?

Descargo de responsabilidad: yo no soy un estadista, sino un ingeniero de software. La mayoría de mis conocimientos en estadística proviene de la auto-educación, con lo que todavía tengo muchas lagunas en la comprensión de los conceptos que puede parecer trivial para otras personas que están aquí. Así que estaría muy agradecido si las respuestas menos términos específicos y más explicación. Imagina que estás hablando con tu abuela :)

Estoy tratando de entender la naturaleza de la distribución beta - lo que debería ser utilizado para y cómo la interpretan en cada caso. Si estuviéramos hablando de, digamos, de la distribución normal, que se podría describir como la hora de llegada de un tren: lo más frecuente es que llega justo a tiempo, un poco menos con frecuencia es 1 minuto antes o 1 minuto tarde y muy rara vez llega con diferencia de 20 minutos de la media. Distribución uniforme describe, en particular, la posibilidad de que cada billete de lotería. Distribución Binomial puede ser descrito con coin flips y así sucesivamente. Pero es tan intuitivo explicación de la distribución beta?

Digamos, $\alpha=.99$ and $\beta=.5$. Beta distribution $B(\alpha, \beta)$ en este caso se ve como este (generado en R):

enter image description here

Pero, ¿qué significa realmente? El eje-Y es, obviamente, una densidad de probabilidad, pero lo que está en el eje de las X?

Yo le agradezco mucho la explicación, ya sea con este ejemplo o cualquier otro.

43voto

kyle Puntos 274

Una distribución Beta se utiliza para modelar las cosas que tienen un rango limitado, como de 0 a 1.

Ejemplos son la probabilidad de éxito en un experimento con sólo dos resultados, como el éxito y el fracaso. Si usted hace un número limitado de experimentos, y algunos tienen éxito, puede representar lo que dice por una distribución beta.

Otro ejemplo es el fin de las estadísticas. Por ejemplo, si se generan varias (digamos 4) uniforme de 0,1 números aleatorios, y ordenarlos, ¿cuál es la distribución de la 3ª?

Yo los uso para entender el rendimiento del software de diagnóstico por muestreo. Si usted deja de un programa al azar $n$ times, and $s$ of those times you see it doing something you could actually get rid of, and $s>1$, then the fraction of time to be saved by doing so is represented by $Beta(s+1, (n-s)+1)$, y el factor de aceleración tiene un BetaPrime de distribución.

Más acerca de eso...

38voto

Ηλίας Puntos 109

La distribución Beta también aparece como un orden de la estadística de una muestra aleatoria independiente de las distribuciones uniformes en $(0,1)$.

Precisamente, vamos a $U_1$, $\ldots$, $U_n$ be $n$ independent random variables, each having the uniform distribution on $(0,1)$. Denote by $U_{(1)}$, $\ldots$, $U_{(n)}$ the order statistics of the random sample $(U_1, \ldots, U_n)$, defined by sorting the values of $U_1$, $\ldots$, $U_n$ in increasing order. In particular $U_{(1)}=\min(U_i)$ and $U_{(n)}=\max(U_i)$. Then one can show that $U_{(k)} \sim \textrm{Beta}(k, n+1-k)$ for every $k=1,\ldots,n$.

Este resultado muestra que la Beta distribuciones naturalmente aparecen en las matemáticas, y tiene algunas aplicaciones interesantes de las matemáticas.

26voto

andynormancx Puntos 234

Hay dos principales motivaciones:

En primer lugar, la distribución beta es conjugado antes de la distribución de Bernoulli. Eso significa que si tienes un desconocido probabilidad como el sesgo de una moneda que se está estimando por repetir la moneda gira, entonces la probabilidad inducida en el desconocido sesgo por una secuencia de tiradas de la moneda se distribuye beta.

En segundo lugar, una consecuencia de la distribución beta de ser una exponencial de la familia es de que es el máximo de entropía de la distribución de un conjunto de suficientes estadísticas. En la beta de la distribución de los casos, estas estadísticas se $\log(x)$ and $\log(1-x)$ for $x$ in $[0,1]$. That means that if you only keep the average measurement of these sufficient statistics for a set of samples $x_1, \dots, x_n$, el mínimo en la suposición de que usted puede hacer sobre la distribución de las muestras es que se distribuye beta.

La distribución beta no es especial, por regla general, el modelado de las cosas [0,1] ya que muchas de las distribuciones puede ser trunca a los que apoyan y son más aplicable en muchos casos.

22voto

carrie bradley Puntos 103

enter image description here

Supongamos que un vendedor en algunos de comercio electrónico sitio web recibe 500 calificaciones de los cuales 400 son buenas y 100 son malos.

Podemos pensar en esto como el resultado de un experimento de Bernoulli de la longitud de 500 que llevó a 400 éxitos (1 = buena), mientras que la probabilidad subyacentes $p$ is unknown.

The naive quality in terms of ratings of the seller is 80% because 0.8 = 400 / 500. But the "true" quality in terms of ratings we don't know.

Theoretically also a seller with "true" quality of $p=77\%$ might have ended up with 400 good of 500 ratings.

The pointy bar plot in the picture represents the frequency of how often it happend in a simulation that for a given assumed "true" $p$ 400 of 500 ratings were good. The bar plot is the density of the histogram of the result of the simulation.

And as you can see - the density curve of the beta distribution for $\alpha=400+1$ and $\beta=100+1$ (orange) tightly surrounds the bar chart (the density of the histogram for the simulation).

So the beta distribution essentially defines the probability that a Bernoulli experiment's success probability is $p$ dado el resultado del experimento.

library(ggplot2)

# 90% positive of 10 ratings
o1 <- 9
o0 <- 1
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim1 <- data.frame(p=rep(0:M/M,v))
df_beta1 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

# 80% positive of 500 ratings
o1 <- 400
o0 <- 100
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim2 <- data.frame(p=rep(0:M/M,v))
df_beta2 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

ggplot(data=df_sim1,aes(p)) +
    scale_x_continuous(breaks=0:10/10) +

    geom_histogram(aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta1 ,aes(p,y),colour=I("red"),size=2,alpha=.5) +

    geom_histogram(data=df_sim2, aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta2,aes(p,y),colour=I("orange"),size=2,alpha=.5)

http://www.joyofdata.de/blog/an-intuitive-interpretation-of-the-beta-distribution/

4voto

mdahlman Puntos 5700

La versión corta es que la distribución Beta puede ser entendido como la representación de una distribución de probabilidades, es decir, representa todos los valores posibles de una probabilidad, cuando no sabemos lo que la probabilidad es. Aquí es mi favorito intuitiva explicación de esto:

Cualquier persona que sigue el béisbol está familiarizado con los promedios de bateo- simplemente el número de veces que un jugador recibe un golpe de la base dividido por el número de veces que se va al bate (por lo que solo un porcentaje de entre 0 y 1). .266 es en general, se considera un promedio de promedio de bateo, mientras que .300 se considera excelente.

Imaginemos que tenemos un jugador de béisbol, y queremos predecir lo que su temporada promedio de bateo será. Se podría decir que sólo podemos utilizar su promedio de bateo hasta ahora, pero esta será una muy baja medida en el comienzo de la temporada! Si un jugador va al bate una vez y obtiene un único, su promedio de bateo es brevemente 1.000, mientras que si se poncha o paseos, su promedio de bateo es de 0.000. No se puede pedir mucho mejor si vas al bate cinco o seis veces - usted podría conseguir una racha de suerte y obtener un promedio de 1.000, o de una mala racha y obtener un promedio de 0, ninguno de los cuales son de forma remota un buen predictor de cómo se bate en la temporada.

¿Por qué es su promedio de bateo en el primer par de hits no es un buen predictor de su eventual promedio de bateo? Cuando un jugador de primer bate es un ponchado, ¿por qué no predecir que nunca va a conseguir un éxito en toda la temporada? Porque vamos con las expectativas previas. Sabemos que en la historia, la mayoría de los promedios de bateo en una temporada han rondado algo como .215 y .360, con algunas excepciones muy raras en cualquiera de los lados. Sabemos que si un jugador se pone un par de ponches en una fila en el inicio, que podrían indicar que se va a terminar un poco peor que el promedio, pero sabemos que probablemente no desviarse de ese rango.

Dado nuestro promedio de bateo problema, que puede ser representada con una distribución binomial (una serie de éxitos y fracasos), la mejor forma de representar estas expectativas previas (lo que en las estadísticas sólo una llamada antes) es que, con la distribución Beta - es decir, antes hemos visto que el jugador tome su primer swing, lo que aproximadamente esperar su promedio de bateo. El dominio de la distribución Beta es (0, 1), sólo como una probabilidad, por lo que ya sabemos que estamos en el buen camino, pero que la adecuación de la Beta para esta tarea va mucho más allá de eso.

Esperamos que el jugador de la temporada-tiempo promedio de bateo más probable es que alrededor de .27, pero que podría razonablemente rango de .21 a .35. Esto puede ser representado con una distribución Beta con parámetros de $\alpha=81$ and $\beta=219$:

curve(dbeta(x, 81, 219))

Beta(81, 219)

I came up with these parameters for two reasons:

  • The mean is $\frac{\alpha}{\alpha+\beta}=\frac{81}{81+219}=.270$
  • Como se puede ver en el gráfico, esta distribución se encuentra casi en su totalidad en (.2, .35)- el rango razonable para un promedio de bateo.

Se le preguntó lo que el eje x representa en una versión beta de la distribución de la densidad de la trama - que aquí se representa su promedio de bateo. Por lo tanto observe que en este caso, no sólo es el eje de la probabilidad (o, más precisamente, de una densidad de probabilidad), pero el eje x es (promedio de bateo es sólo una probabilidad de un éxito, después de todo)! La distribución Beta es la representación de una distribución de probabilidad de las probabilidades.

Pero he aquí por qué la distribución Beta es tan apropiado. Imaginar el jugador obtiene un solo golpe. Su récord de la temporada es ahora 1 hit; 1 at bat. , Entonces, tenemos que actualizar nuestras probabilidades queremos cambiar esta toda la curva más sólo un poco para reflejar la nueva información. Mientras las matemáticas para demostrar esto es un poco implicado (que se muestra aquí), el resultado es muy simple. La nueva Beta de distribución será:

$\mbox{Beta}(\alpha_0+\mbox{hits}, \beta_0+\mbox{misses})$

Where $\alpha_0$ and $\beta_0$ are the parameters we started with- that is, 81 and 219. Thus, in this case, $\alpha$ has increased by 1 (his one hit), while $\beta$ has not increased at all (no misses yet). That means our new distribution is $\mbox{Beta}(81+1, 219)$, or:

curve(dbeta(x, 82, 219))

enter image description here

Notice that it has barely changed at all- the change is indeed invisible to the naked eye! (That's because one hit doesn't really mean anything).

However, the more the player hits over the course of the season, the more the curve will shift to accommodate the new evidence, and furthermore the more it will narrow based on the fact that we have more proof. Let's say halfway through the season he has been up to bat 300 times, hitting 100 out of those times. The new distribution would be $\mbox{Beta}(81+100, 219+200)$, or:

curve(dbeta(x, 81+100, 219+200))

enter image description here

Notice the curve is now both thinner and shifted to the right (higher batting average) than it used to be- we have a better sense of what the player's batting average is.

One of the most interesting outputs of this formula is the expected value of the resulting Beta distribution, which is basically your new estimate. Recall that the expected value of the Beta distribution is $\frac{\alpha}{\alpha+\beta}$. Thus, after 100 hits of 300 real at-bats, the expected value of the new Beta distribution is $\frac{81+100}{81+100+219+200}=.303$- notice that it is lower than the naive estimate of $\frac{100}{100+200}=.333$, but higher than the estimate you started the season with ($\frac{81}{81+219}=.270$). Usted podría notar que esta fórmula es equivalente a la adición de un "head start" para que el número de visitas y no-hits de un jugador - que estás diciendo "iniciar con él en la temporada con 81 golpes y 219 sin hits en su historial").

Por lo tanto, la distribución Beta es el mejor para representar una distribución probabilística de las probabilidades- en el caso de que no sabemos lo que una probabilidad es un adelanto, pero tenemos algunas conjeturas razonables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: