40 votos

Propósito de la función de enlace en el modelo lineal generalizado

¿Cuál es el propósito de la función de enlace como un componente del modelo lineal generalizado? ¿Por qué la necesitamos?

Estados de Wikipedia:

Puede ser conveniente para que coincida con el dominio de la función de enlace para la gama media de la función de distribución

¿Cuál es la ventaja de hacer esto?

41voto

JeremyDWill Puntos 2181

A. J. Dobson señaló lo siguiente en su libro:

  1. La regresión lineal se supone que la respuesta de la variable se distribuye normalmente. Modelos lineales generalizados pueden tener variables de respuesta con otras distribuciones de la distribución Normal– que incluso puede ser categórico en lugar de continua. Por lo tanto ellos no pueden rango de$-\infty$$+\infty$.

  2. Relación entre la respuesta y las variables explicativas no necesitan ser de la simple forma lineal.

Esta es la razón por la que necesitamos la función de enlace como un componente del modelo lineal generalizado. Vincula la media de la variable dependiente $Y_i$, $E(Y_i)=\mu_i$ a que el término lineal $x_i^T\beta$ de tal manera que el rango de la no-linealmente transformado media de $g(\mu_i)$ rangos de$-\infty$$+\infty$. Por lo tanto usted puede en realidad la forma de una ecuación lineal $g(\mu_i)$=$x_i^T\beta$ y el uso de una forma iterativa reponderadas método de mínimos cuadrados para la estimación de máxima verosimilitud de los parámetros del modelo.

20voto

Sean Hanley Puntos 2428

Puede ayudar a leer mi respuesta aquí: Diferencia entre los modelos logit y probit, que trata de GLiM vínculos algo ampliamente.

La forma básica de explicar este problema se presenta claramente por @BlainWaan, y la Wikipedia: El parámetro real (por ejemplo, $p$ por un binomio de la respuesta, es decir, la regresión logística) puede variar desde el infinito negativo hasta el infinito positivo, pero tu predicción de parámetro. La segunda gran razón es que, sin especificar correctamente el enlace, las varianzas de los residuos no va a ser constante (requerido una suposición para la inferencia con una estimación de mínimos Cuadrados Ordinarios) o se manipula correctamente.

Otro camino a seguir en este tema es que usando la identidad de enlace (esta es otra manera de decir / pensar 'no usando una función de enlace) significa que usted está pensando en su situación de forma incorrecta en un camino que necesariamente distorsiona la imagen de la situación que se derivan de su análisis. Por ejemplo, a menos que el verdadero probabilidades de que usted está tratando de modelo (de nuevo por regresión logística de los casos) sólo existen en el medio de la gama (donde son bastante lineales), y el rango de $X$ examen se centra en el punto donde $p=.5$, su betas estará sesgada y su predijo $\hat p_{x_i}$'s va a estar lejos de los verdaderos valores. Además, su inferencias distorsionada (por ejemplo, el tipo de la tasa de error no igual $\alpha$).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X