7 votos

Método preferido para identificar efecto curvilíneo en marco de regresión multi-variable

Dicen algunos de los resultados anteriores se identificó un efecto curvilíneo de X en Y, (específicamente que X tenía un efecto positivo en la y, y que X^2 tuvo un efecto negativo). Quieres ver si el mismo es válido para su totalmente diferente de la muestra (aunque todo lo demás entre los estudios, construcciones/medidas, son exactamente los mismos). Ni el estudio anterior ni mi estudio experimental (así que no soy la manipulación de X, simplemente observando). Explícitamente no hay razón teórica de por qué un efecto curvilíneo que se producen.

Voy a dar algunos ejemplos de cómo tendría que ir a ver si esto es cierto, pero me gustaría alguna opinión y las opiniones de los pueblos en lo que ellos creen que sería una copa de método, si alguna de mis sugerencias son innapropriate, y por supuesto, si hay otras alternativas.

Ejemplos:

1) Simplemente examinar la bivariante diagrama de dispersión y ajuste algún tipo de suavizado de la línea de la media de Y sobre bandejas de X (por ejemplo, LOESS). A pesar de la confusión puede ser un problema, si un efecto curvilíneo existe su probable de ser cierta evidencia en su distribución.

2) Examinar la regresión parcial de la parcela o de otras técnicas de visualización para identificar el efecto de X en Y independiente de otras variables de confusión.

3) el Uso de algún tipo de modelo de criterios de selección (por ejemplo, BIC), y determinar si un modelo que incluye X^2 es preferible a un modelo sin X^2

4) Incluir un modelo con X^2 y ver si X^2 tiene una diferencia estadísticamente significativa del coeficiente de regresión.

Como he dicho otras sugerencias son bienvenidas.

Edit: En este contexto, mi principal preocupación es identificar si el efecto de X en Y es el mejor representado en una manera similar a la del estudio anterior. Mientras que su podría ser de otra manera sustantiva puntos de interés para comparar entre los estudios (como la magnitud del efecto de X sobre Y), este no es mi principal preocupación.

50voto

RobertTheGrey Puntos 5509

Suena como si usted está interesado en la educación formal de la inferencia y para que el método 4 es el mejor. Agregar X^2 para un modelo que contiene los términos que desea controlar y realizar una prueba para evaluar la streght de pruebas por el término cuadrático dado los términos en el modelo. Nota sin embargo que "la ausencia de evidencia no es evidencia de ausencia" y el poder estadístico entrarán en juego (esto es de interés si no se puede rechazar o el CI contiene cero). Usted willof supuesto, también quieren realizar diagnósticos de los supuestos del modelo antes de sacar conclusiones.

Los métodos 1 y 2 son excelentes exploratorio de herramientas y me gustaría animar a explorar la relación en tantas maneras significativas como desee (ya que usted sabe a priori lo formal de la prueba se llevará a cabo -- una prueba de que el término cuadrático -- esto no conducirá a basado en datos de pruebas de hipótesis). Otros métodos de exploración incluyen el trazado de una cocina bien LOESS más suave o spline para el (posiblemente parcial), las relaciones, el ajuste de suavizadores o paramétricos encaja dentro de los subconjuntos de los datos (por ejemplo, mediante el acondicionamiento de las parcelas), un 3d diagrama de dispersión con una cocina equipada superficie (especialmente si se incluyen interacciones continuas), etc. Estas parcelas no sólo le ayudará a entender los datos que mejor, pero también puede ser utilizado como parte de una manera menos formal de caso para/contra la cuadrática (teniendo en cuenta que los seres humanos son excelentes para detectar tendencias en los niveles de ruido).

No estoy seguro de cuál es el modelo de selección de los métodos que se refiere en 3, pero en general automatizado de selección del modelo y pruebas no se mezclan. Si usted se refiere a la utilización de los criterios de información (AICc, BIC, ...) tenga en cuenta que la teoría detrás de estos se basa en la predicción lugar de la prueba. Así, el número 4 es la más rigurosa prueba de la ecuación cuadrática.

Por último, 2 comentarios sobre la terminología:

  • 'multivariante' modelos son aquellas cuya respuesta es una matriz, y 'multivariable' modelos son aquellos con un vector de respuesta y varios términos en el lado derecho.

  • Parcial de los gráficos de residuos difieren de regresión parcial de las parcelas..

1voto

Judioo Puntos 625

Gracias de nuevo por la respuesta, y cualquier otras respuestas en el futuro será muy apreciada. Creo yo, personalmente, prefiero el uso exploratorio de herramientas para identificar las relaciones, especialmente desde que el investigador original no se da ninguna razón real por la que una relación curvilínea que existen en teoría. Aunque la exploración sería identificar si la relación no fue debidamente identificados (por ejemplo, si que debería haber sido un cubicado polinomio plazo en lugar de cuadrado), esto parece poco probable dado que no hay razón por la que tendría una curva en la que, para empezar.

La imagen adjunta es una parcela de varios de sus modelos finales, y me han conspirado para que el valor esperado de Y dado su X y X^2 coeficientes reportados, manteniendo todo lo demás en los modelos constante. Si sus resultados son representativos, yo debo observar resultados similares en mi muestra de controlar por otros factores de confusión. También es esclarecedor sólo para graficar sus resultados, como yo veo el cuadrado término domina en varios de los modelos, y así para todos los efectos prácticos, tiene una relación negativa que llega a la parte inferior de realista Y valores muy rápidamente.

alt text

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X