Caratterizzazione di estremi vincolati
Ciao a tutti! Per motivi universitari sto ripassando il programma di analisi II e svolgendo un esercizio su massimi e minimi vincolati mi è venuto un dubbio.
Supponiamo di aver mostrato che il punto $(0,0)$ è un punto che annulla il gradiente della lagrangiana $f(x,y)-lambda*g(x,y)$ (in particolare viene che il gradiente è nullo in $(x,y,lambda) = (0,0,2)$). Come posso dire che il punto trovato è un minimo/massimo e non un punto di sella? Basta guardare gli autovalori dell'Hessiano di $f$ nel punto considerato? O ci sono altri metodi?
Edit. Specifico che la funzione $f$ è incognita, conosco solo il valore di gradiente e hessiano in $(0,0)$. Altrimenti bastava andare per ispezione con gli altri punti estremanti immagino
Supponiamo di aver mostrato che il punto $(0,0)$ è un punto che annulla il gradiente della lagrangiana $f(x,y)-lambda*g(x,y)$ (in particolare viene che il gradiente è nullo in $(x,y,lambda) = (0,0,2)$). Come posso dire che il punto trovato è un minimo/massimo e non un punto di sella? Basta guardare gli autovalori dell'Hessiano di $f$ nel punto considerato? O ci sono altri metodi?
Edit. Specifico che la funzione $f$ è incognita, conosco solo il valore di gradiente e hessiano in $(0,0)$. Altrimenti bastava andare per ispezione con gli altri punti estremanti immagino
Risposte
Devi guardare l'hessiano, ma della funzione lagrangiana, non di $f$, perché per $f$ quel punto è un punto di estremo vincolato, quindi dell'hessiano non ci importa, mentre per la lagrangiana quel punto è un punto di estremo libero.
Ottimo, grazie mille!
Questo problema mi interessa, e intuitivamente anche io avrei risposto come Vulplaisir, ma credo che non sia corretto. Per esempio, cerchiamo massimi e minimi di
\[
f(x, y)=y\]
sul vincolo
\[
g(x, y)=x^2+y^2-1=0.\]
Sappiamo che il massimo e il minimo rispettivamente cadono nei punti \((x, y)=(0, \pm 1)\). Applicando l'idea di Vulplaisir di studiare gli estremi liberi della funzione lagrangiana
\[
L(x, y, \lambda)=f(x, y)-\lambda g(x, y)\]
troviamo al primo ordine le condizioni corrette, naturalmente:
\[
x=0\quad y=\pm 1\quad \lambda = \pm\frac12.\]
Ma al secondo ordine troviamo nei punti \((0, \pm 1)\) la matrice Hessiana
\[
HL(0, \pm1, \pm \frac12 ) =\mp \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 2 \\ 0 & 2 & 0\end{bmatrix}\]
che ha sia autovalori positivi sia autovalori negativi. E quindi concluderemmo, *erroneamente*, che i due punti trovati sono di sella.
---
La corretta analisi di secondo ordine per stabilire se un punto critico è un massimo/minimo locale o una sella è contenuta in questo vecchio post di Gugo:
viewtopic.php?p=358372#p358372
\[
f(x, y)=y\]
sul vincolo
\[
g(x, y)=x^2+y^2-1=0.\]
Sappiamo che il massimo e il minimo rispettivamente cadono nei punti \((x, y)=(0, \pm 1)\). Applicando l'idea di Vulplaisir di studiare gli estremi liberi della funzione lagrangiana
\[
L(x, y, \lambda)=f(x, y)-\lambda g(x, y)\]
troviamo al primo ordine le condizioni corrette, naturalmente:
\[
x=0\quad y=\pm 1\quad \lambda = \pm\frac12.\]
Ma al secondo ordine troviamo nei punti \((0, \pm 1)\) la matrice Hessiana
\[
HL(0, \pm1, \pm \frac12 ) =\mp \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 2 \\ 0 & 2 & 0\end{bmatrix}\]
che ha sia autovalori positivi sia autovalori negativi. E quindi concluderemmo, *erroneamente*, che i due punti trovati sono di sella.
---
La corretta analisi di secondo ordine per stabilire se un punto critico è un massimo/minimo locale o una sella è contenuta in questo vecchio post di Gugo:
viewtopic.php?p=358372#p358372
"dissonance":
La corretta analisi di secondo ordine per stabilire se un punto critico è un massimo/minimo locale o una sella è contenuta in questo vecchio post di Gugo:
viewtopic.php?p=358372#p358372
Ecco... Mi ricordavo di aver scritto qualcosa in merito, ma non trovavo il post.
Grazie per averlo recuperato.

"gugo82":
[quote="dissonance"]La corretta analisi di secondo ordine per stabilire se un punto critico è un massimo/minimo locale o una sella è contenuta in questo vecchio post di Gugo:
https://www.matematicamente.it/forum/vi ... 72#p358372
Ecco... Mi ricordavo di aver scritto qualcosa in merito, ma non trovavo il post.
Grazie per averlo recuperato.

Riesumo questo post perché ho avuto la sensazione che il vecchio post di Gugo sia sbagliato. Ma non sono riuscito a trovare un controesempio. Mi piacerebbe avere una opinione, non sono sicuro di essere nel giusto.
Gugo dice che, dato il problema di ottimizzazione vincolata
\[
\max\{ f(x)\ |\ g(x)=1\}, \]
detto \(Z=\{g=1\}\) il vincolo, la condizione necessaria di secondo ordine affinché il punto critico \(x_0\) sia un massimo locale è che
\[\tag{!}
f''_{x_0}(v, v)\le 0, \quad \forall v\in T_{x_0} Z.\]
Qui \(T_{x_0} Z\) è lo spazio tangente la varietà \(Z\) nel punto \(x_0\); naturalmente stiamo assumendo che \(Z\) sia non degenere, nel senso che le derivate prime di \(g\) non siano tutte nulle in nessun punto di \(Z\). Il punto \(x_0\) è critico vincolato, nel senso che esiste \(\mu\in\mathbb R\) che è un moltiplicatore di Lagrange;
\[\tag{1}
f'_{x_0}(w) = \mu g'_{x_0}(w),\qquad \forall w\in\mathbb R^n.\]
Qui le derivate sono nel senso direzionale; quindi, ad esempio,
\[
f'_{x_0}(w):=\frac{\partial}{\partial t} f(x_0+tw)|_{t=0},\]
e analogamente le derivate seconde;
\[
f''_{x_0}(w_1, w_2):=\frac{\partial}{\partial t}\frac{\partial}{\partial s}f(x_0+tw_1+sw_2)|_{t, s=0}.\]
Secondo i miei calcoli, la corretta condizione di secondo ordine non è (!), ma è invece
\[\tag{*}
f''_{x_0}(v, v)-\mu g''_{x_0}(v,v) \le 0, \qquad \forall v\in T_{x_0} Z;\]
dove \(\mu\) è il moltiplicatore di Lagrange, definito in precedenza.
Dimostrazione. Se \(\gamma\colon \mathbb R\to Z\) è una curva differenziabile, e \(\gamma(0)=x_0\), la condizione necessaria affinché \(t=0\) sia un massimo locale per la funzione di una sola variabile \(t\mapsto f(\gamma(t))\) è
\[
\frac{\partial^2}{\partial t^2}f(\gamma(t))|_{t=0}\le 0.\]
Sviluppando tale derivata si ottiene
\[
f''_{x_0}(\dot{\gamma}(0), \dot{\gamma}(0))+ f'_{x_0}(\ddot{\gamma}(0))\le 0,\]
e usando (1),
\[\tag{2}
f''_{x_0}(\dot{\gamma}(0), \dot{\gamma}(0))+ \mu g'_{x_0}(\ddot{\gamma}(0))\le 0,\]
ma d'altra parte, \(g(\gamma(t))\equiv 1\), quindi differenziando due volte si ottiene che
\[
g''_{x_0}(\dot{\gamma}(0),\dot{\gamma}(0))+g'_{x_0}(\ddot{\gamma}(0))=0, \]
che, inserito nella (2), dimostra la (*) con \(v=\dot\gamma(0)\). Siccome tutti i vettori in \(T_{x_0} Z\) sono di tipo \(\dot{\gamma}(0)\) per qualche curva \(\gamma\) come sopra, la dimostrazione di (*) è completa.
\(\square\).
Sto rileggendo il mio post precedente, rendendomi conto che è un po' difficile rispondere, perché sono andato a pescare un post di Gugo vecchio di quasi 10 anni, come fosse stato scritto ieri.
@Gugo: se sei in ascolto, e se ti ricordi da dove la hai presa, potresti darmi la dimostrazione, o una referenza, per la proprietà di questo post:
https://www.matematicamente.it/forum/vi ... 72#p358372
per favore? Grazie!
@Gugo: se sei in ascolto, e se ti ricordi da dove la hai presa, potresti darmi la dimostrazione, o una referenza, per la proprietà di questo post:
https://www.matematicamente.it/forum/vi ... 72#p358372
per favore? Grazie!