59 votos

¿Por qué es el gradiente normal?

Esto es un poco larga conversación, así que tengan paciencia conmigo. Hay un teorema que siempre he tenido curiosidad por conocer desde un punto de vista intuitivo. Este es un tema que ha sido glosado en la mayoría de los libros de texto que he leído. Citando a Wikipedia, El teorema es:

"El gradiente de una función en un punto es perpendicular a la de ajuste de nivel de f en ese punto."

http://en.wikipedia.org/wiki/Level_set#Level_sets_versus_the_gradient

Entiendo que el artículo de Wikipedia de la prueba, que es la forma habitual de ver las cosas, pero veo la prueba como algo mágico. Se da una simbólica la razón por la que el teorema es verdadero sin dar mucha intuición geométrica.

El gradiente da la dirección de mayor aumento, de modo que es una especie de sentido que una curva es perpendicular sería constante. Por desgracia, este parece ser el razonamiento hacia atrás. Habiendo notado ya que la pendiente es la dirección de mayor aumento, se puede deducir que va en una dirección perpendicular a la que sería la más lenta de aumento. Pero no podemos realmente la razón por la que este más lento aumento es cero ni tampoco se puede argumentar que va en una dirección perpendicular a una dirección constante nos daría una dirección de mayor aumento.

Yo también agradecería alguna relación de este con la intuición Multiplicadores de Lagrange que es de otro algo mágico teorema para mí. Entiendo porque el álgebra de las obras, pero lo que está pasando en geométricamente? http://en.wikipedia.org/wiki/Lagrange_multipliers

Por último, ¿qué dice esto de manera intuitiva acerca de la generalización en el que estamos buscando: maximizar f(x,y), donde g(x,y) > c

Siempre he luchado para encontrar la correcta modelo interno que encapsular estas ideas.

18voto

Bob Puntos 34449

El gradiente de una función que es normal para los conjuntos de nivel porque es definido de esa manera. El gradiente de una función es no el derivado natural. Cuando se tiene una función f, definida en algún espacio Euclidiano (en general, un colector de Riemann), entonces su derivada en un punto, digamos x, es una función dxf en los vectores de tangentes. La forma intuitiva de pensar es que dxf(v) responde a la pregunta:

Si me muevo infinitesimalmente en la dirección de v, lo que sucede a f?

De manera que dxf no es en sí mismo un vector tangente. Sin embargo, como tenemos un producto interior en todo mentira, se puede convertir en un vector tangente a la que llamamos ∇f. Esto representa la pregunta:

¿Qué vector tangente u en x representa mejor dxf?

Lo que queremos decir por "representa mejor" es que u debe satisfacer la condición:

<u,v> = dxf(v) para todos los vectores tangente v

Ahora nos fijamos en el conjunto de nivel de f a través de la x. Si v es un vector tangente en x, que es tangente al nivel establecido entonces dxf(v) = 0, ya que f no cambia si vamos (infinitesimalmente) en la dirección de v. por lo tanto, nuestro vector ∇f (aka u en la pregunta) debe satisfacer <∇f, v> = 0. Es decir, ∇f es normal para el conjunto de vectores tangente en x que son tangentes al nivel establecido.

Para un genérico x y un genérico de f (es decir, la mayoría del tiempo), el conjunto de vectores tangente en x que son tangentes a el conjunto de nivel de f en x es codimension 1 tal especifica ∇f hasta un escalar múltiples. El escalar múltiples pueden ser encontradas en un vector tangente v tales que f no cambia en la v de la dirección. Si no v existe, entonces ∇f = 0, por supuesto.

9voto

Matthew Ruston Puntos 176

Si usted se encuentra en un conjunto de nivel y quiere caminar algunos pequeños distancia d y llegar lo más lejos posible del conjunto de nivel, quiere caminar a lo largo de la normal. De lo contrario, si la ruta de acceso que usted toma, tiene una componente tangente, se tiende a mantenerse más cerca del nivel de conjunto, si d es lo suficientemente pequeño en comparación con el tamaño del conjunto de nivel. Además, llegar lo más lejos posible de su conjunto de nivel es aproximadamente el mismo que caminar hasta el más alto/más bajo de la curva de nivel de la gama, con la aproximación a mejorar como d se reduce.

7voto

NotMyself Puntos 7567

Como para los multiplicadores de Lagrange (tomando la interpretación geométrica de la gradiente), creo que la mejor manera de ver lo que está pasando es considerar las 2 de la variable de caso. La idea es que usted está generalmente limitada a algunos de la curva g(x,y)=0 (que es sólo una determinada curva de nivel de la función g(x,y)). Considerar las curvas de nivel de la función objetivo f(x,y). Si, moviéndose a lo largo de la curva de restricción, estamos atravesando una de estas curvas de nivel de f(x,y), entonces (sujeto a restricciones) estamos ya sea aumentando o disminuyendo el valor de f(x,y). Por lo tanto, no podemos estar en un local del extremo. Así, un extremo debe producirse en donde g(x,y)=0 es tangente a una curva de nivel de f(x,y). Esto es equivalente a la condición de que los vectores perpendiculares a las curvas apuntan en la misma dirección: grad(f)=λgrad(g).

3voto

Paul Williams Puntos 7390

Esta es, esencialmente, Andrew Stacey la respuesta, pero un poco más bajo nivel. Esta es la historia que en realidad se trata de conseguir mi cálculo 3 los estudiantes a comprender.

Deje que $F: \mathbb{R}^2 \to \mathbb{R}$. Entonces la derivada de $D_{F,p}$ es lineal en el mapa de $D_{F,p}:\mathbb{R}^2 \to \mathbb{R}$, cuya matriz con respecto a la norma base es de $[ \dfrac{\partial F}{\partial x} \dfrac{\partial F}{\partial y}]$.

Esta es la única lineal mapa que satisface $F(p+h) = F(p)+D_{F,p}(h)+Error(h)$, donde $\displaystyle\lim_{h \to 0} \dfrac{|Error(h)|}{|h|} = 0$. Note que $p$ y $h$ son dos vectores en $\mathbb{R}^2$.

Lo bueno es aproximadamente lineal mapas de $\mathbb{R}^n \to \mathbb{R}$ es que se ven como productos de puntos! En este caso $D_{F,p}(\langle a,b \rangle) = [ \dfrac{\partial F}{\partial x} \dfrac{\partial F}{\partial y}] \begin{bmatrix}\\\\ b\end{bmatrix} = \dfrac{\partial F}{\partial x} + \dfrac{\partial F}{\partial y}b = \langle \dfrac{\partial F}{\partial x} \dfrac{\partial F}{\partial y} \rangle \cdot \langle a, b\rangle$. Este punto de vista alternativo sobre la derivada es útil, porque te da una diferente interpretación geométrica de la derivada. Llamamos a $\langle \dfrac{\partial F}{\partial x} \dfrac{\partial F}{\partial y} \rangle$ el gradiente de $F$.

Ahora nos interesa la curva de $F(x,y) = 0$. Dado un punto $p=(x_1,y_1)$ en esta curva, la dirección de la tangente será el vector $h$ de los cuales $D_{F,p}(h) = 0$, ya que para permanecer en la curva, el valor de la función no debe cambiar a la primera orden. El uso de la interpretación geométrica en términos de productos de puntos, podemos ver que $\langle \dfrac{\partial F}{\partial x} \dfrac{\partial F}{\partial y} \rangle \cdot \langle h_1, h_2\rangle = 0$, o geométricamente que el gradiente es perpendicular a la dirección de la tangente!

3voto

Haacked Puntos 31070

Me gusta esta intuición:

El paquete de vectores tangente a la superficie en un punto de vivir en el plano tangente en ese punto. La tangente[s] hasta el nivel establecido en ese punto son exactamente los vectores en el plano tangente cuya "vertical" componente es cero. El vector[s] que apunta en la dirección de mayor crecimiento son aquellos con una mayor relación "vertical" de los componentes. Geometría del plano (en el plano tangente) muestra que estos deben ser perpendiculares.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: