9 votos

Usando análisis de componentes principales análisis vs correspondencia

Yo soy el análisis de un conjunto de datos relativos a intermareal de las comunidades. Los datos son porcentajes de cobertura (de algas, percebes, mejillones, etc) en quadrats. Estoy acostumbrado a pensar sobre el análisis de correspondencias (CA) en términos de especies de cuenta, y el análisis de componentes principales (PCA) como algo más útil para el lineal ambiental (no en especie) de las tendencias. Realmente no he tenido ninguna suerte averiguar si PCA o CA sería una mejor opción para el por ciento de cobertura (no se puede encontrar en cualquiera de los documentos), y ni siquiera estoy seguro de cómo algo que es un tope de hasta el 100% será distribuido?

Estoy familiarizado con las directrices generales que si la longitud de la primera sin tendencia en el análisis de correspondencias (DCA), el eje es mayor que 2, entonces se puede asumir con seguridad que el CA debe ser utilizado. La longitud de DCA eje 1 fue de 2.17, que no me parece útil.

1voto

David J. Sokol Puntos 1730

PCA obras en los valores donde como CA obras en los valores relativos. Ambos están muy bien para la abundancia relativa de los datos de la clase que usted menciona (con una importante salvedad, ver más adelante). Con % datos que ya tienen una medida relativa, pero aún así habrá diferencias. Pregúntate a ti mismo

  • ¿desea resaltar el patrón en la abundancia de especies/taxones (es decir, aquellas con un gran %de cobertura), o
  • ¿usted quiere centrarse en los patrones de composición relativa?

En el primer caso, el uso de la PCA. Si el último uso de CA. Lo que quiero decir con las dos preguntas que se le quiere

A = {50, 20, 10}
B = { 5,  2,  1}

para ser consideradas diferentes o el mismo? A y B son dos muestras y los valores son el %de cobertura de tres taxones se muestra. (En este ejemplo resultó mal, asumir que hay en el suelo! ;-) PCA consideraría muy diferentes debido a la distancia Euclidiana utilizado, pero CA pueda considerar estas dos muestras como muy similares porque tienen la misma relación de perfil.

La gran advertencia aquí es el cierre de la composición de la naturaleza de los datos. Si usted tiene un par de grupos (Arena, Limo, Arcilla, por ejemplo) que se suma a 1 (100%), a continuación, ninguno de los enfoques es correcta y se puede mover a una más adecuada a través de análisis de Aitchison de Registro de la relación de la PCA, el cual fue diseñado para cerró los datos de composición. (IIRC para hacer esto usted necesita para centro de filas y columnas, y el registro de transformar los datos.) Hay otros enfoques. Si el uso de R, entonces un libro que puede ser útil es el Análisis de los Datos de Composición con R.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X