8 votos

Demostración de parcialidad de cuantiles muestra

Mientras que hace algunas simulaciones, me di cuenta de que el cuantil de la muestra es un estimador sesgado de la verdadera cuantil. Y, según mi simulaciones, potencialmente muy sesgada.

Me sorprendió con ese resultado, ya que el CDF empírica no es parcial, pero después de algunas investigaciones en internet, descubrí que era cierto.

Traté de averiguar donde el sesgo viene, pero trabajando con la muestra de cuantiles es bastante difícil. ¿Alguien tiene una demostración de que el sesgo (e, idealmente, una cuantificación)?

5voto

Bill Puntos 16

El sesgo en la estimación de $p$-cuantiles es investigado en una distribución libre de la manera en

http://www.sciencedirect.com/science/article/pii/S016771520000242X

(un pdf se puede encontrar en la misma página). Los autores se centran en el cuantil estimador basado en ECDF inversión. No supuestos sobre la distribución subyacente (excepto finito segundo momento), así también distribuciones discretas están incluidos.

Algunos aspectos destacados:

  • El sesgo es proporcional a la desviación estándar $\sigma$ de la distribución subyacente

  • El sesgo es menor en el centro de cuantiles que en los extremos. Esto se deriva del hecho de que, entre todas las distribuciones con desviación estándar $\sigma < \infty$, el sesgo oscila en un intervalo de longitud de $\frac{\sigma}{\sqrt{p (1-p)}}$. Sorprendentemente, este no depende del tamaño de la muestra $n$.

  • Para $np>3$, entre todas las distribuciones estandarizadas (media 0, desviación estándar 1), el peor de los prejuicios está asociada con la distribución de tener un átomo de probabilidad $p$ $-\sqrt{(1-p)/p}$ y un átomo de probabilidad $1-p$$\sqrt{p/(1-p)}$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: