42 votos

Cómo hacer la detección de la comunidad en un promedio ponderado de la red social/graph?

Me pregunto si alguien podría sugerir lo que son buenos puntos de partida a la hora de realizar la detección de la comunidad/gráfico partición/agrupación en clústeres en un gráfico que se ha ponderado, sin bordes. El gráfico en cuestión tiene aproximadamente 3 millones de bordes y cada borde expresa el grado de similitud entre los dos vértices que se conecta. En particular, en este conjunto de datos son los bordes de los individuos y los vértices son una medida de la similitud de su comportamiento observado.

En el pasado he seguido la sugerencia de que llegué aquí en stats.stackexchange.com y se utiliza igraph la implementación de Newman, la modularidad de la agrupación y se mostró satisfecho con los resultados, pero eso fue en un conjunto de datos sin ponderar.

Existen algoritmos específicos que debo observar?

Muchas gracias por cualquier consejo ~l

20voto

mika Puntos 971

igraph implementación de Newman, la modularidad de la agrupación (fastgreedy función) puede ser utilizado con la ponderación de los bordes. Sólo añadir peso atributo a los bordes y analizar como de costumbre. En mi experiencia, correr incluso más rápido que con las pesas, ya que hay menos ataduras.

9voto

DavLink Puntos 101

Sé que Gephi puede procesar grafo grafo ponderado, pero me parece recordar que tiene que ser almacenado en el GDF, que está muy cerca de la CSV, o Ucinet DL. Ser conscientes de que todavía es una versión alpha. Ahora, sobre la agrupación de el gráfico, Gephi parece a la falta de agrupación en clústeres de tuberías, excepto para el MCL algoritmo que ahora está disponible en la última versión. Hubo un Proyecto de Código de Google en 2009, Gephi de Estadísticas de la Red (por ejemplo, con la de Newman modularidad métrica), pero no sé si algo ha sido publicado en esta dirección. De todos modos, parece permitir algún tipo de modularidad/agrupación de cómputos, pero véase también el Análisis de redes Sociales el uso de R y Gephi y preparación de los Datos para el Análisis de redes Sociales el uso de R y Gephi (Muchas gracias a @Tal).

Si usted está acostumbrado a Python, vale la pena probar NetworkX (Aquí hay un ejemplo de un grafo ponderado con el código correspondiente). Entonces usted tiene muchas maneras de llevar a cabo su análisis.

Usted también debe mirar a INSNA - Análisis de redes Sociales Software o Tim Evans de la página web acerca de las Redes Complejas y la Complejidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: