9 votos

Es mi estadístico amigo bien/mal en la métrica de los espacios y de las normas?

Yo estaba hablando con un estadístico amigo mío, quien dijo que en lugar de minimizar esta función $\sum_{i,j}W_{ij}d_{ij}^2(X)$ $X$ sería mejor para resolver un análogo problema de minimización $\sum_{i,j}W_{ij}||f(Y_{i.})-f(Y_{j.})||_\mathcal{H}$ $f$ lugar con la norma de ser un RKHS(Reproducir Kernel Espacio de Hilbert) norma donde las funciones $f(.)$ provienen de un espacio de Hilbert de funciones. Ambos minimizations están bajo la restricción de que $\sum_{i,j}d^2_{i,j}(X)$ o $\sum_{i,j}||f(Y_{i.})-f(Y_{j.})||_\mathcal{H}$ está limitada a un fijo real valor positivo $\nu$.

Aquí, $d_{ij}^2(X)$ es la distancia Euclídea al cuadrado entre las filas $i,j$ de los bienes matriz desconocida $X$. $Y$ es un fijo real de la matriz.

Pregunta: ¿Por qué el último problema dentro de la función de espacio de estar mejor!? ¿Qué hace el RKHS norma ofrecer, que es diferente de la distancia euclidiana/norma? A partir de esta descripción, ¿por qué crees que mi amigo académico ha dicho esto-cuando el pensamiento de matemáticos diferentes direcciones? ¿Qué estamos ganando o perdiendo entre estas dos formulaciones? Después de todo, una vez que el $f(.)$ se soluciona, las normas parecen ser la preservación de algún tipo de noción de la distancia/disimilitud o cercanía. ¿Qué tiene de especial el segundo problema!? Entiendo que la pregunta es un poco abiertas. Así que por favor siéntase libre de ser detallado en la expresión de sus pensamientos!

Perspectiva: Yo le mostró la inicial Euclidiana problema. Él pensó y plantea otro problema es muy interesante. Por favor, arrojar sus pensamientos.

2voto

Halfgaar Puntos2866

Esta no es una respuesta, de por sí, pero algunas observaciones generales.


Lo que estás buscando es similar a una curva de ajuste problema o una regresión problema: usted tiene algunos datos, y le gustaría encontrar alguna función que se ajuste a estos datos, en algunos minimizar sentido. Debido a que utiliza la diferencia entre las observaciones, obviamente no es tan sencillo, pero hay cierta similitud aquí.

Los estadísticos y analistas de datos, a menudo los datos de la vista como el efecto de una causa. Mientras que algunos son felices para modelar el efecto (por ejemplo, la obtención de una función que se ajusta a los datos, y diciendo: "a-ha! El efecto se parece a esto!"), una más interesante el problema es tratar de inferir la estructura que subyace en el origen de los datos-la comprensión de la mecánica de la causa. Por supuesto, usted no está realmente la comprensión de la causa sin algunos extrínseca de la información, sino que es como nos gusta pensar en él. Algunas mediciones de $y$ son el resultado de un proceso físico $f$ actúa sobre algunos insumos $x$.

Hay muchas, muchas maneras de hacer esto, muchos de los cuales son más o menos equivalentes. Como @mtiano mencionado, el modelo de constructores de amor el espacio de Hilbert de las normas.

Lo que es un espacio de Hilbert norma de compra, en este caso, es una noción que usted puede encontrar algunas de las funciones que los modelos de la causa, y, a continuación, haciendo así que se puede obtener un modelo de los efectos de forma gratuita.

En otras palabras, en lugar de interpolar un montón de datos de salida, usted está buscando una función que opera en algunos fijos de entrada de datos; una vez que tenga esa función, usted puede hacer todas las cosas que haría con un interpolant, pero ahora se puede vincular directamente que interpolant para algunas de las variables independientes.

Dependiendo de su enfoque de análisis de datos, hay muchas formas de abordar este problema. Cosas como las redes neuronales, de adaptación estimación de los parámetros de los algoritmos, cuasi-Newton métodos de búsqueda, etc. tienden a defecto a $L^2$-minimización. Yo apuesto a que en la ingeniería y las estadísticas de papeles, $L^2$ es por lejos el más común de "optimización de espacio."

$L^2$, por supuesto, es un espacio de Hilbert. Y nos gusta Hilbert espacios, porque ellos han interior de los productos, y el interior de los productos son cosas que tienden a surgir de forma natural en muchos de estos análisis.

Por supuesto, usted no tiene que trabajar en $L^2$ si no se adapta a su aplicación. Pero todo el trabajo que se ha hecho en el desarrollo de algoritmos y técnicas de análisis para la optimización y el análisis de datos en $L^2$ se va a traducir casi de inmediato a algún otro espacio de Hilbert.

No tener el producto interior significa que usted podría tener que realizar algún trabajo adicional, y en el final, todo lo que tienes es un interpolant en algunos de los datos observados, sin la intuición con respecto a los factores de proceso que ha realizado la mira como lo hace.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: