4 votos

¿tiene sentido para los no-negativa de datos para restar la media y dividir por el std dev?

Es un procedimiento habitual para restar la media y dividir por la desviación estándar de un conjunto de datos. Si no hacer frente a la negativa de datos, es decir, de la imagen, (en [0,1] o [0,255]), ¿este procedimiento sentido? Violar la no-negativo de la restricción, ¿qué sucede?

Puedo añadir algunas consideraciones adicionales.

Supongamos que usted tiene una imagen y se descompone en un conjunto de la superposición de los parches. ¿Por qué debe restar la media y dividir por el std dev para cada parche (violando la no-neg antes)?

Este procedimiento también se utiliza en el diccionario de aprendizaje y de codificación dispersa. En diccionario de aprendizaje, dada una imagen ($y$), un enfoque estándar se dividen en un conjunto de parches ($p$), luego restar la media ($p_m$) y dividiendo por la desviación std ($p_s$).

Es un paso crucial si los datos son no-negativos?

2voto

cbeleites Puntos 12461

Primero de todo, ha habido varias preguntas sobre la normalización ya, por ejemplo,

Restando la media es una forma de centrar sus datos: La media se convierte en el nuevo origen en la "nube de puntos" descripción de los datos (cada caso es un punto en $p$ dimensiones, para imágenes RGB, $p = 3$). Correctamente centrada en los datos puede conducir a numéricamente más estable modelos, centrado y también puede ayudar en la interpretación de los datos y de los modelos: se establece una "línea de base", y el centro de datos de los registros de las desviaciones de este.
Si esto es una idea sensata dependerá de los datos: para algunos de los datos que tiene sentido, para otros datos de otro centro puede ser más apropiado, sin embargo, otros conjuntos de datos que ya tienen un útil centro. E. g. en el ejemplo de la estrella de fotografías, puede que desee para encontrar el promedio de color de fondo y restar.

Dividiendo por la desviación estándar (o la varianza) que estandariza los datos. Esto puede ser útil para lograr la igualdad de los pesos de todos los canales de entrada en el posterior análisis de datos. En otros casos, no es sensato. El último puede muy bien ser el caso de los datos: su varia ya comparten su unidad física. Sin embargo, puede que desee calibrar para corregir la longitud de onda de la dependencia de la sensibilidad de la cámara (whitelight de la corrección).

También puede que desee ajustar todos los canales juntos: que sería el ajuste de contraste y brillo, que son también una forma de centro y estandarizar.

1voto

davidsheldon Puntos 211

Desde la mención de codificación dispersa, supongo que se refiere a las imágenes naturales.

Para los naturales de las imágenes, la estandarización es a menudo llevado a cabo porque la imagen natural de los parches tienen bastante estable propiedades estadísticas una vez que se resta la parte constante (y blanqueados; ver más abajo). Usted puede mirar como esta: Una imagen natural del parche $p$ tiene un promedio lumination (la media de la revisión) y de contraste (la desviación estándar de la revisión). Si usted está interesado en el contenido de la revisión, entonces es una buena idea para restar la media lumination y dividen el contraste con el mapa de la imagen parches con el mismo contenido en el mismo punto.

Imagen Natural parches tienen bastante estable propiedades estadísticas después de restar la media (también se llama a menudo componente continua (DC). Por referencia, usted podría mirar en los papeles por David del Campo, Bruno Olshausen, David Ruderman, Eero Simoncelli, Matías Bethge, o Aapo Hyvaerinen. Curiosamente, las estadísticas de la componente DC varía mucho de una imagen a otra (si muestra muchos parches de una imagen), pero las propiedades estadísticas de los parches son bastante estables. Esto es cierto en particular para blanquear los parches, es decir, cuando se divide por la desviación estándar en la PCA (un blanqueamiento de la matriz no es única, pero el PCA versión es una opción posible). Tenga en cuenta que muchos de codificación dispersa modelos están realmente capacitados en el DC-resta y la pintaron de imagen natural parches.

En resumen: Para imágenes naturales, que te gusta hacer en la estandarización debido a que la probabilidad de los modelos equipados con la estandarización de los parches de generalizar mejor de la imagen a la imagen.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: