11 votos

Agrupamiento espacial de los datos en R

Tengo un set de temperatura superficial del mar (SST) datos mensuales y quiero aplicar algunos de racimo metodología para detectar las regiones con similares patrones de SST. Tengo un conjunto de datos mensuales de los archivos que se ejecutan desde el año 1985 hasta año 2009 y desea aplicar clustering para cada mes, como un primer paso.

Cada archivo contiene la cuadrícula de datos para 358416 puntos donde aproximadamente el 50% son de tierra y están marcados con un 99.99 valor que va a ser NA. Formato de datos:

   lon     lat   sst
-10.042  44.979  12.38
 -9.998  44.979  12.69
 -9.954  44.979  12.90
 -9.910  44.979  12.90
 -9.866  44.979  12.54
 -9.822  44.979  12.37
 -9.778  44.979  12.37
 -9.734  44.979  12.51
 -9.690  44.979  12.39
 -9.646  44.979  12.36

He intentado CLARA método de agrupación y de algunos aparentemente buenos resultados, pero también me parece que es sólo suavizado (agrupación) isolíneas. Entonces yo no estoy seguro de que este es el mejor método de agrupamiento analizar datos espaciales.

¿Hay algún otro método de agrupación dedicada a este tipo de conjuntos de datos? Alguna referencia sería bueno empezar a leer.

Gracias de antemano.

33voto

David Cumps Puntos 370

Un muy bien documentado biblioteca de python para el análisis espacial que tiene algunos agrupación es pySAL.

Otra biblioteca de python en la etapa de desarrollo que se centra en la agrupación espacial es clusterPy pdf(presentación de diapositivas).

Con una selección más limitada de algoritmos de clustering aunque con una buena asignación de la interfaz es la interfaz gráfica de usuario de software GeoGrouper.

2voto

lambacck Puntos 346

Hay diferentes enfoque escalable a la agrupación, la de dividir y conquistar enfoque paralelo de la agrupación y las copias incrementales. Esto es para el enfoque general después de que usted puede utilizar normales métodos de agrupamiento. Hay un buen método de agrupación que realmente aprecio es DBSCAN (Basados en la Densidad de Agrupamiento Espacial de las Aplicaciones con el Ruido) es uno de los más utilizados en el algoritmo de agrupamiento.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: