4 votos

Dos distribuciones normales

Voy a marcar esto como tarea para casa, aunque sólo sean de interés general. El escenario es un poco tonto, porque es sólo un mundo real caso de un problema teórico que he estado pensando.

Un hombre entra en un concurso de comer perros calientes cada año y en el concurso tiene que comer 10 perritos calientes en 5 minutos (si es diferente a la normal hotdog concursos):

Tan pronto como el hombre come su 5ª hotdog (a mitad de camino para acabar con ellos) el momento en que se registra, y cuando se come a su final hotdog el momento en que se registra de nuevo. ASÍ que tenemos dos conjuntos de datos que puede ser aproximada con distribuciones normales, es decir, cuánto tiempo toman sot comer 5 perros calientes y cuánto comer 10.

Llamar a la primera media y std dev $\mu_{h}, \sigma_{h}$ (h por la mitad) y la segunda de la distribución de la media y la std dev $\mu_{f}, \sigma_{f}$. Ambos medios son en cuestión de minutos.

Este año, el hombre entra en el concurso y se ve que él toma $\mu_{h} +\epsilon$ minutos para finalizar el quinto hotdog, para algunos $\epsilon > 0$, es decir, que es más lento que de costumbre.

Mi pregunta es, ¿a qué hora podemos esperar que el hombre dos finalizar el concurso, y la forma de calcular esto? Pensando en ello, pensé que sería mejor considerar las dos distribuciones como una distribución normal bivariante. Así que si tenemos la primera variable aleatoria $X$, como el tiempo que toma llegar a la mitad, y $Y$ como el tiempo necesario para terminar, quiero $E(Y|X =\mu_{h} +\epsilon )$.

No sé si esto es correcto pensar, por favor me corrija si estoy equivocado. También no sé cómo ir sobre cómo calcular el anterior valor esperado. Cualquier ayuda es bienvenida.

3voto

AdamSane Puntos 1825

Sólo una nota sobre el cálculo de este tipo de condicional expectativas.

Voy a usar una notación diferente de usted, porque he tratado con este problema antes (en dos ambientes muy diferentes) y quiero usar la notación estoy acostumbrado a jugar con él en (donde ni siquiera estamos tratando con el tiempo, pero una cosa diferente que se acumula).

La llamada de los primeros 5 perritos calientes 'tarea ' 1' y el próximo 5 perritos calientes 'tarea ' 2'.

Deje $X$ el momento de finalizar la primera tarea, y $Y$ el tiempo para terminar la segunda tarea (por lo $X+Y$ es el tiempo para terminar todo lo que hay).

Después de la primera tarea, observamos $X=x$. Queremos $\text{E}(X+Y|X=x)$.

$$\text{E}(X+Y|X=x) = \text{E}(X|X=x) + \text{E}(Y|X=x) = x + \text{E}(Y|X=x)$$

Ahora, ¿qué hacemos con $\text{E}(Y|X=x)$?

Si $X$ $Y$ son independientes, se puede poner $\mu_Y$; si son casi independientes, esta será una buena aproximación.

(que resulta ser una sorprendentemente buena aproximación en una de esas tareas)

De manera más general, se podría hacer algo como la esperanza condicional en un bivariante normal (ya que usted habla de dos normales):

$$\text{E}(Y|X=x) = \mu_Y + \text{Cov}(X,Y) \text{Var}(X)^{-1} (x-\mu_X) $$

(Si esto se parece a la regresión, que no es un accidente.)

En su caso, el término final entre paréntesis sería $\epsilon$.

Así que al final termina de tiempo total $x + \mu_Y + \gamma(x-\mu_X)$ donde $\gamma$ es esencialmente un coeficiente de regresión de la población.

Así que para predecir lo que le sucede a la expectativa en la segunda tarea se le da a lo que sucedió en el primero, usted necesita saber acerca de cómo se co-varían en relación a la varianza de la primera tarea. (De hecho, esto sugiere que si usted no conoce a estas cantidades, se podría estimar la relación de datos por regresión. Sin embargo, si usted ya sabe/puede asumir la correlación o covarianza, usted puede escribir la correspondiente ecuación.)

(He pasado por alto algunos de los supuestos implicados aquí.)

2voto

Eero Puntos 1612

Si usted es feliz con el normal bivariante de la asunción (y parece una aproximación razonable a mí), entonces el valor esperado de Y dado X es solo la predicción de un modelo de regresión lineal. Las fórmulas estándar para la regresión lineal pueden ser derivados, ya sea asumiendo los valores de X son fijos, o que X e y son bivariante normal, de cualquier manera las fórmulas para los coeficientes de regresión son los mismos.

Así que si usted tiene los datos del pasado que sólo puede poner en una rutina de regresión y hacer una predicción.

Si usted no tiene los datos, pero no tienen los parámetros de la normal bivariante (2 medios, 2 varianzas (o desviación estándar), y uno de covarianza (o correlación)) puede conectar esas en las fórmulas y obtener la ecuación de regresión para predecir con.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: