13 votos

Necesita ayuda para identificar una distribución por su histograma

Tengo la muestra de la población de una determinada señal registrado máximos de amplitud. La población es de alrededor de 15 millones de muestras. Me produce un histograma de la población, pero no puede adivinar la distribución con un histograma.

EDIT1: Archivo raw valores de la muestra es la siguiente: datos en bruto

¿Alguien puede ayudar a estimar la distribución con el siguiente histograma: enter image description here

23voto

Alp Puntos 446

Uso fitdistrplus:

Aquí está el CRAN enlace a fitdistrplus.

Aquí está la vieja viñeta enlace para fitdistrplus.

Si la viñeta enlace no funciona, hacer una búsqueda de "Uso de la biblioteca fitdistrplus para especificar una distribución de datos".

La viñeta de hace un buen trabajo de explicar cómo utilizar el paquete. Usted puede mirar en cómo las distintas distribuciones de ajuste en un corto período de tiempo. Se produce también una Cullen/Frey Diagrama.

#Example from the vignette
library(fitdistrplus)
x1 <- c(6.4, 13.3, 4.1, 1.3, 14.1, 10.6, 9.9, 9.6, 15.3, 22.1, 13.4, 13.2, 8.4, 6.3, 8.9, 5.2, 10.9, 14.4)
plotdist(x1)
descdist(x1)

f1g <- fitdist(x1, "gamma")
plot(f1g)
summary(f1g)      

enter image description here

enter image description here

7voto

AdamSane Puntos 1825

La población es de alrededor de 15 millones de muestras.

Entonces es muy probable que sea capaz de rechazar a una distribución particular de un simple, forma cerrada.

Incluso esa pequeña protuberancia en la parte izquierda de la gráfica es probable que sea suficiente para hacernos decir "claramente no es tal y tal'.

Por otro lado, es probablemente muy bien aproximada por una serie de distribuciones comunes; los candidatos obvios son cosas como logarítmico-normal y gamma, pero hay un anfitrión de otros. Ella se mira en el registro de la x-variable, probablemente, usted puede decidir si la lognormal está bien a la vista (después de la toma de registros, el histograma debe buscar simétrica).

Si el registro se encuentra a la izquierda de sesgo, considere si la Gamma está bien, si está bien sesgar, considere si la inversa de rayos Gamma (o incluso más skew) inversa Gaussiana está bien. Pero este ejercicio es uno más de la búsqueda de una distribución que está lo suficientemente cerca como para vivir con; ninguna de estas sugerencias en realidad tiene todas las características que parecen estar presentes allí.

Si usted tiene alguna teoría para mantener a una elección, tirar toda esta discusión y el uso que.

1voto

Taylor Price Puntos 371

No estoy seguro de por qué se quiere clasificar una muestra de una distribución específica con una muestra de gran tamaño; la parsimonia, y la comparan con otra muestra, buscando la interpretación física de los parámetros?

La mayoría de los paquetes estadísticos(R, SAS, Minitab) permiten trazar los datos en un gráfico que se obtiene una línea recta si los datos provienen de una distribución particular. He visto los gráficos de rendimiento de una línea recta si los datos son normales(log normal-después de una transformación logarítmica), Weibull, y chi-cuadrado vengan a la mía inmediatamente. Esta técnica le permite ver los valores atípicos y dar la posibilidad de dar razones de por qué los puntos de datos de los valores atípicos. En R, la probabilidad normal de la parcela se llama qqnorm.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X