54 votos

Mejores prácticas en el análisis de diseños pre-post tratamiento-control

Imagine el siguiente diseño común:

  • 100 participantes son asignados al azar a un tratamiento o a un grupo control
  • la variable dependiente es numérico y medición pre - y post - tratamiento

Tres opciones obvias para el análisis de datos son:

  • Prueba el grupo por el tiempo el efecto de interacción en la mezcla de ANOVA
  • Hacer un ANCOVA con la condición de que la IV y la pre - medida como la covariable y post medir como el DV
  • Hacer una prueba t con la condición de que la IV y pre-post de las puntuaciones de cambio como el DV

Pregunta:

  • ¿Cuál es la mejor manera de analizar dichos datos?
  • Hay razones para preferir un enfoque sobre otro?

9voto

Jared Farrish Puntos 120

Las estrategias más comunes serían:

  1. ANOVA de medidas repetidas con uno de sujeto factor (pre vs post-test) y un factor entre-sujetos (tratamiento vs control).
  2. ANCOVA en el post-tratamiento de los puntajes, con pre-tratamiento de puntuación como covariable y el tratamiento como una variable independiente. Intuitivamente, la idea es que un examen de las diferencias entre ambos grupos es realmente lo que usted está después de, e incluyendo pre-calificaciones de la prueba como covariable puede aumentar la energía en comparación con una simple t-test o test de ANOVA.

Hay muchos debates sobre la interpretación, suposiciones, y al parecer paradójico diferencias entre estos dos enfoques y en más sofisticados alternativas (especialmente cuando los participantes no pueden ser asignados al azar a tratamiento), pero sigue siendo bastante normal, creo.

Una importante fuente de confusión es que para el análisis de la VARIANZA, el efecto de interés es más probable que la interacción entre el tiempo y el tratamiento, y no el tratamiento de los efectos principales. Por cierto, el F-test para este término de interacción producirá exactamente el mismo resultado que una t de muestras independientes prueba en las puntuaciones de la ganancia (es decir, los puntajes obtenidos restando el pre-test, la puntuación de la post-prueba de puntuación para cada participante) por lo que también puede ir para eso.

Si todo esto es demasiado, usted no tiene tiempo para averiguarlo, y no puede obtener la ayuda de un estadístico, un rápido y sucio pero de ninguna manera completamente absurda enfoque sería simplemente comparar el post-test de las puntuaciones con una t de muestras independientes prueba, ignorando el pre-test de los valores. Esto sólo tiene sentido si los participantes en los hechos fueron asignados al azar al tratamiento o grupo de control.

En fin, que no es en sí una muy buena razón para elegir, pero sospecho que se acercan a los 2 de arriba (ANCOVA), es lo que actualmente pasa por el enfoque correcto en psicología así que si usted elige algo más que usted podría tener que explicar la técnica en detalle o para justificar a alguien que está convencido de que, por ejemplo, que "los resultados de ganancia son conocidos por ser malo".

7voto

DavLink Puntos 101

Hay una enorme literatura en torno a este tema (cambio/resultados de ganancia), y creo que la mejor de las referencias provienen del dominio de la biomedicina, por ejemplo,

Senn, S (2007). Problemas estadísticos en el desarrollo de fármacos. Wiley (cap. 7 pp. 96-112)

En la investigación biomédica, interesante trabajo ha sido realizado en el estudio de cross-over ensayos (esp. en relación a la prórroga de los efectos, aunque no sé cuán aplicable es a su estudio).

De Obtener la Puntuación t a ANCOVA F (y viceversa), de Knapp & Schaffer, ofrece un interesante análisis de ANCOVA vs t enfoque (el llamado del Señor Paradoja). El análisis simple de las puntuaciones de cambio no es la forma recomendada para pre/post de diseño según Senn en su artículo el Cambio de línea de base y análisis de covarianza revisited (Stat. Med. 2006 25(24)). Por otra parte, utilizando un modelo de efectos mixtos (por ejemplo, para dar cuenta de la correlación entre los dos puntos de tiempo) no es mejor porque usted realmente necesita para utilizar el "pre" de la medición como covariable para aumentar la precisión (a través de la adaptación). Muy brevemente:

  • El uso de las puntuaciones de cambio (post - $ - $ pre, o el resultado $-$ línea de base) no resuelve el problema de desequilibrio; la correlación entre el pre y el post de medición es < 1, y la correlación entre el pre y post ($- $ pre) es generalmente negativo-de ello se deduce que si el tratamiento (su grupo de asignación) que se mide por los resultados parciales pasa a ser una desventaja injusta en comparación con el control, tendrá una ventaja injusta con las puntuaciones de cambio.
  • La varianza del estimador utilizado en ANCOVA es generalmente inferior a la de los crudos o puntuaciones de cambio (a menos que la correlación entre el pre y el post es igual a 1).
  • Si el pre/post de relaciones diferentes entre los dos grupos (pendiente), no es mucho de un problema que para cualquier otro de los métodos (el cambio de las puntuaciones de enfoque también se supone que la relación es idéntica entre los dos grupos, la pendiente paralela a la hipótesis).
  • Bajo la hipótesis nula de igualdad de trato (en los resultados), no hay interacción tratamiento x línea de base se espera; es peligroso para adaptarse a un modelo de este tipo, pero en este caso se debe utilizar centrado en las líneas de base (de lo contrario, el efecto del tratamiento se estima en la covariable origen).

También me gustan los Diez Diferencia de Puntuación de los Mitos de Edwards, aunque se centra en la diferencia de las puntuaciones en un contexto diferente; pero aquí es una bibliografía anotada en el análisis de pre-post de cambio (por desgracia, no es muy reciente trabajo). Van Breukelen también en comparación ANOVA vs ANCOVA aleatorios y no aleatorios de configuración, y sus conclusiones apoyan la idea de que ANCOVA es preferible, al menos en estudios aleatorizados (que impide la regresión a la media del efecto).

5voto

Eric Davis Puntos 1542

Daniel B. Wright discute en la sección 5 de su artículo Haciendo Amigos con sus Datos. Él sugiere (p.130):

El único procedimiento que siempre es la correcta en esta situación es un diagrama de dispersión la comparación de las puntuaciones en tiempo 2 con aquellos que en el momento 1 de la los diferentes grupos. En la mayoría de los casos debe analizar los datos en varios maneras. Si los enfoques que se le dan diferentes los resultados ... creo que más cuidadosamente sobre el modelo implícita por cada uno de ellos.

Él recomienda los siguientes artículos como lectura adicional:

  • Mano, D. J. (1994). La deconstrucción de cuestiones estadísticas. Diario de la Sociedad Real de Estadística: Una, 157, 317-356.
  • Señor, F. M. (1967). Una paradoja en la interpretación de las comparaciones de grupos. Psychological Bulletin, 72, 304-305. Gratis PDF
  • Wainer, H. (1991). El ajuste por diferencial de tipos de base: el Señor de la paradoja de nuevo. Psychological Bulletin, 109, 147-151. Gratis PDF

-2voto

Krysta Puntos 289

Ya tienes dos medios (ya sea de un elemento específico, o de la suma del inventario), no hay ninguna razón para considerar un análisis de VARIANZA. Una prueba t pareada es probablemente apropiado; esto puede ayudarlo a elegir la prueba t que usted necesita.

¿Quieres mirar en el apartado de los resultados, o en general las puntuaciones? Si usted desea hacer un análisis de ítems, esto podría ser un útil punto de partida.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X