6 votos

¿Cómo clasificar los resultados de las preguntas con respuestas categóricas?

Estoy trabajando con los resultados de una encuesta que tiene múltiples preguntas. Todas las respuestas (en este caso) son categóricas y ordinales (como muy infeliz, infeliz, neutral, feliz, muy feliz).

Estoy buscando una manera de ordenar las preguntas desde las que tienen "peores resultados" hasta las que tienen "mejores resultados". Obtener los extremos es algo fácil visualmente. Si grafico la distribución de las respuestas de cada pregunta, puedo identificar qué preguntas tienen muchas respuestas "buenas" (la distribución está sesgada negativamente) o las que tienen muchas respuestas "malas" (histograma sesgado positivamente). Así que recogiendo los extremos es fácil, pero esto también depende de los datos.

Sin embargo, cuantitativamente no sé qué hacer. Como las respuestas están en una escala ordinal, pero no en una escala de intervalo, no sé cómo calcular un número agregado para cada pregunta. Quizás dar un valor numérico a cada categoría (como -2, -1, 0, 1 o 2) y sumar los resultados podría funcionar si no hay nada mejor, pero me doy cuenta de que matemáticamente esto no es exacto ya que no es una escala de intervalo.

No soy un estadístico, sólo un programador. Espero que haya una opción razonable para esto, puedo imaginar que es una pregunta bastante común con datos categóricos.

Gracias de antemano.

PS Yo uso R en caso de que haya algo incorporado.

35voto

AdamSane Puntos 1825

Un pequeño punto adicional a las respuestas ya dadas:

Sin asumir que sus datos ordinales son de intervalo, puede comparar cualquier cuantil conveniente, por ejemplo, las medianas.

O, cuando se comparan X frente a Y, que son ambas categóricas ordenadas, se puede estimar algo como P(Y>X) - P(X>Y) o P(Y>X) + 0,5 * P(Y=X) (etc.), donde se estiman las probabilidades por proporciones, por supuesto.

5voto

Omar Kooheji Puntos 384

Si grafico la distribución de las respuestas de cada pregunta, puedo identificar las preguntas que tienen muchas respuestas "buenas" (la distribución está sesgada negativamente) o las que tienen muchas respuestas "malas" (histograma sesgado positivamente). Así que elegir los extremos es fácil, pero esto también depende de los datos.

¿Es necesaria una clasificación absoluta? Como señalas, las cosas pueden ser más confusas en el medio, así que ¿es relevante para tu investigación distinguir entre el rango 8 y el 9 (o el que sea) basándote en algún método de puntuación?

Un enfoque sería continuar con lo que has dicho antes: mirar las distribuciones y categorizar las preguntas en función de las proporciones de bueno/bueno/malo según los datos. Podría empezar con un gráfico de mosaico (con las preguntas como factores) para explorar sus datos. Esto puede ayudar a revelar los criterios para agrupar las preguntas. En lugar de clasificaciones fragmentarias, se clasifican en categorías (por ejemplo, lo que podría haber sido el rango 1-5 se convierte en la categoría 1, etc.).

4voto

jldugger Puntos 7490

Puede clasificar los ordinales distribuciones por medio de una interfaz intuitiva de dominación criterio: las respuestas a una pregunta son mejores que las respuestas a otra cuando es más probable que no que un elegido al azar respuesta a la primera va a ser mejor que un elegido al azar respuesta a la segunda.

En más detalle: poner todas las respuestas a la pregunta $X$ en un sombrero y todas las respuestas a la pregunta $Y$ en otro sombrero. Dibujar una respuesta de cada sombrero al azar. Vamos a comparar estas respuestas, lo que podemos hacer porque están en una escala ordinal. También vamos a estar de acuerdo para resolver los empates, lanzando una moneda. Deje $p(X,Y)$ la probabilidad de que la respuesta a la $X$ es mejor que la respuesta a la $Y$. Rango $X$ por $Y$ al $p$ supera $1/2$ y el rango de $X$ detrás de $Y$ al $p$ es de menos de $1/2$. Si $p$ es igual a $1/2$, declarar un empate entre el$X$$Y$. (Por virtud de nuestra tie-procedimiento de resolución de $p(X,Y) + p(Y,X) = 1$, lo que implica la clasificación no depende de la secuencia en la que se trazan las dos respuestas.)


El cálculo es un simple ejercicio de "sólo" un programador (y de una diversión si usted está interesado en el cálculo eficiente, a pesar de que es poco probable que importa aquí). Para hacer esta propuesta clara, sin embargo, voy a ilustrar. Supongamos que todas las respuestas están en una parte integral de la escala de uno a cuatro, con los cuatro mejores. Escribe la respuesta de las distribuciones en el formulario de $(k_1, k_2, k_3, k_4)$ donde $k_3$ cuenta el número de "3"'s entre las respuestas a una pregunta, por ejemplo. Para este ejemplo, supongamos $X$ $(4, 2, 0, 4)$ $Y$ $(1, 6, 1, 2)$ (diez respuestas de cada uno). (Parar por un momento para considerar que una de estas distribuciones deben ser considerados "los mejores" y nota que tienen idénticos medios de 2.4 idéntica y medianas de 2, lo que sugiere que esta es una difícil comparación a hacer.) Entonces:

  • Hay un 4/10 oportunidad de dibujar un "4" para $X$. En este caso,
    • Hay un 2/10 oportunidad de dibujar un "4" para $Y$ para un empate;
    • Hay un 8/10 probabilidad de extraer menos de "4" para $Y$, una victoria para $X$.

Esto contribuye $(4/10)[(2/10)0.5 + 8/10] = 0.36$$p(X,Y)$. Continuando del mismo modo,

  • Dibujo de un "3" para $X$ es imposible; contribuye $0$$p(X,Y)$.
  • Dibujo de un "2" para $X$ contribuye $(2/10)[(6/10)0.5 + 1/10] = .08$.
  • Dibujo de un "1" para $X$ contribuye $(4/10)[(1/10)0.5] = 0.02$.

De dónde $p(X,Y) = 0.36 + 0.00 + 0.08 + 0.02 = 0.46$. Debido a que este valor es menor que $1/2$, llegamos a la conclusión de $X$ debe ser clasificado menor de $Y$.


Esta idea está relacionada con la de Pitman Cercanía y a algunos no-paramétrico de deslizamiento de las pruebas (que decidir si una distribución tiene "resbaló" - cambió de valores con respecto a otras distribuciones basadas en muestras aleatorias de ellos), como la u de Mann-Whitney (aka Wilcoxon) de la prueba.

4voto

Eric Davis Puntos 1542

Si todas las preguntas tienen la misma escala de respuesta y son ítems Likert estándar, escalar el ítem 1,2,3,4,5 y tomar la media suele estar bien.

Se puede investigar la solidez del ordenamiento de los rangos experimentando con diferentes procedimientos de escalamiento (por ejemplo, 0, 0, 0, 1, 1 es común cuando se quiere evaluar el porcentaje feliz o muy feliz; o de acuerdo o muy de acuerdo). Según mi experiencia, estas variantes de escalado le darán un ordenamiento de las preguntas casi idéntico. También podría explorar componentes principales de escalamiento óptimo o alguna forma de enfoque IRT politómico si quiere ser sofisticado.

Una tabla con tres columnas estaría bien: rango, texto del artículo, media. También se podría hacer lo mismo con la pregunta en el eje x y la media en el eje y.

3voto

DavLink Puntos 101

Recodificar los datos con valores numéricos parece correcto, siempre que se mantenga la hipótesis de una escala ordinal. Este suele ser el caso de los ítems de tipo Likert, pero vea estas preguntas relacionadas:

Al validar un cuestionario, a menudo proporcionamos los resúmenes numéricos habituales (media $\pm$ sd, rango, cuartiles) para resaltar el efecto techo/suelo, es decir, una mayor tasa de respuesta en el rango extremo de la escala. Los gráficos de puntos también son una gran herramienta para resumir estos datos.

Esto es sólo a efectos de visualización/resumen. Si quieres entrar en temas más estadísticos, puedes utilizar el modelo de probabilidades proporcionales o la regresión logística ordinal, para los elementos ordinales, y la regresión multinomial, para los discretos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X