Condizioni sufficienti del secondo ordine per un massimo

ambrina1555
ciao a tutti!! spero di non sbagliare a postare la domanda.. io avrei bisogno di aiuto per una dimostrazione. il teorema è questo (condizione sufficiente per un massimo locale):

Sia f : X ⊆ R ^n → R,f ∈ C^2 (X), x*∈ X. Inoltre valgano le seguenti due condizioni:
- ∇f(x*)=0
- ∇^2 f(x* ) è definita negativa.
Allora x* è un punto di massimo locale per f.

Dimostrazione:
la formula di taylor arrestata al secondo ordine è:
f(x*+ αd )-f(x* )= αd' ∇f(x* )+1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
dove d è una qualsiasi direzione ammissibile che parte da x*. Per la prima condizione, αd' ∇f(x* )=0, quindi la formula diventa: f(x*+ αd )-f(x* )=1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
Dato che x* è un punto di massimo per ipotesi, f(x*+ αd )-f(x* )≤0 e quindi (data l'uguaglianza) anche il secondo membro deve essere ≤0.
1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)≤0
Essendo °(‖αd‖^2), per α che tende a 0, “un infinitesimo di ordine superiore” a ‖αd‖^2, °(‖αd‖^2) non influisce sul segno del secondo membro.Quindi 1/2 α^2d^T ∇^2 f(x* ) d≤0 e d^T ∇^2 f(x*) d≤0 , ∀d ∶d' ∇f(x* )=0 e ciò dimostra il teorema.

In sostanza la parte rossa non mi è chiara... ho trovato questa dimostrazione su un libro e la prof mi ha detto che non è precisa.. se qualcuno può aiutarmi mi sarebbe veramente di aiuto!!! o se qualcuno ha una dimostrazione a tale condizione diversa da quella che ho scritto io va bene lo stesso...

Risposte
gugo82
Che bisogno c'è di entrare in una stanza urlando?
Elimina il maiuscolo dal titolo, grazie.

ambrina1555
aaaaah... va bene.. l'ho messo in minuscolo...

gugo82
"ambrina1555":
Sia f : X ⊆ R ^n → R,f ∈ C^2 (X), x*∈ X. Inoltre valgano le seguenti due condizioni:
- ∇f(x*)=0
- ∇^2 f(x* ) è definita negativa.
Allora x* è un punto di massimo locale per f.

Dimostrazione:
la formula di taylor arrestata al secondo ordine è:
f(x*+ αd )-f(x* )= αd' ∇f(x* )+1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
dove d è una qualsiasi direzione ammissibile che parte da x*. Per la prima condizione, αd' ∇f(x* )=0, quindi la formula diventa: f(x*+ αd )-f(x* )=1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
Dato che x* è un punto di massimo per ipotesi, f(x*+ αd )-f(x* )≤0 e quindi (data l'uguaglianza) anche il secondo membro deve essere ≤0.
1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)≤0
Essendo °(‖αd‖^2), per α che tende a 0, “un infinitesimo di ordine superiore” a ‖αd‖^2, °(‖αd‖^2) non influisce sul segno del secondo membro.Quindi 1/2 α^2d^T ∇^2 f(x* ) d≤0 e d^T ∇^2 f(x*) d≤0 , ∀d ∶d' ∇f(x* )=0 e ciò dimostra il teorema.

In sostanza la parte rossa non mi è chiara... ho trovato questa dimostrazione su un libro e la prof mi ha detto che non è precisa.. se qualcuno può aiutarmi mi sarebbe veramente di aiuto!!! o se qualcuno ha una dimostrazione a tale condizione diversa da quella che ho scritto io va bene lo stesso...

Vogliamo dimostrare che nelle ipotesi poste esiste una sferetta \(B(x^*;r)\) tale che:
\[
\tag{1}
f(x)\leq f(x^*)
\]
per \(x\in B(x^*;r)\).

Innanzitutto, visto che \(x^*\) è interno al dominio della \(f\), possiamo sempre scegliere un \(R>0\) tale che \(B(x^*;R)\) è tutta contenuta nel dominio di \(f\).
Per ogni fissato \(x\in B(x^*;R)\) possiamo altresì scrivere \(x=x^*+a\mathbf{d}\), con \(\mathbf{d}\) versore ed \(a\) scalare opportuni (in particolare \(\mathbf{d}\) è un versore dell'unica retta per \(x\) ed \(x^*\), ed \(a\) è il parametro che individua \(x\) su tale retta nell'equazione parametrica); in particolare, dato che \(\mathbf{d}\) è un versore, si ha \(\|x-x^*\|=\|(x^*+a\mathbf{d}) -x^*\|=|a|\|\mathbf{d}\|=|a|\), quindi si ha certamente \(|a| Quindi, per mostrare la (1) occorre e basta provare che la disuguaglianza:
\[\tag{2}
f(x^*+a\mathbf{d}) \leq f(x^*)
\]
vale per ogni versore \(\mathbf{d}\) e per ogni \(a\) sufficientemente vicino a \(0\), indipendentemente da \(\mathbf{d}\).

La funzione composta \(\phi (a):=f(x^*+a\mathbf{d})\) è definita almeno nell'intervallo \(]-R,R[\) ed è ivi derivabile due volte; quindi possiamo applicare la formula di Taylor al secondo ordine a \(\phi\) in \(0\) e trovare:
\[
\phi (a)=\phi(0) + \phi^\prime (0)\ a+\frac{1}{2}\ \phi^{\prime \prime} (0)\ a^2 + \omega(a)\; ,
\]
in cui \(\omega (a)=\text{o}(a^2)\).
Data la definizione di \(\phi\) e visto che vale il teorema di derivazione delle funzioni composte, si trova:
\[
\begin{split}
\phi (a) &=f(x^*+a\mathbf{d}) \\
\phi^\prime (a) &= \langle \nabla f(x^*+a\mathbf{d}), \mathbf{d}\rangle\\
\phi^{\prime \prime} (a) &= \langle \nabla^2 f(x^*+a\mathbf{d})\ \mathbf{d}, \mathbf{d}\rangle
\end{split}
\]
(qui \(\langle \cdot ,\cdot \rangle\) è il prodotto scalare di \(\mathbb{R}^N\)), cosicché la formula precedente si riscrive:
\[
\begin{split}
f(x^*+a\mathbf{d}) &= f(x^*) + \langle \nabla f(x^*), \mathbf{d}\rangle + \frac{1}{2} \langle \mathbf{d}, \nabla^2 f(x^*)\ \mathbf{d} \rangle\ a^2 + \omega(a)\\
&= f(x^*) + \frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a)\; ,
\end{split}
\]
ove si è tenuto presente che \(f(x^*+0\mathbf{d})=f(x^*)\) e \(\nabla f(x^*)=\mathbf{0}\).
Pertanto, mostrare la (2) equivale a mostrare che la disuguaglianza:
\[ \tag{3}
\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a)\leq 0
\]
vale per ogni versore \(\mathbf{d}\) e per ogni \(a\) sufficientemente vicino a \(0\), indipendentemente da \(\mathbf{d}\).

La funzione:
\[
\mathbf{d} \mapsto C(\mathbf{d}):=\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle
\]
(che fornisce il terzo coefficiente di Taylor nella formula precedente) definita su \(\mathbb{S}^{N-1}=\partial B(\mathbf{0};1)\) è ovunque negativa (perché la matrice hessiana è definita negativa) e continua. Dato che \(\mathbb{S}^{N-1}\) è compatto (poiché chiuso e limitato), \(C\) ha massimo assoluto e tal massimo è \(\leq 0\); d'altra parte, poiché tale massimo è certamente preso su una direzione \(\mathbf{d}^*\in \mathbb{S}^{N-1}\), i.e. \(\max C = C(\mathbf{d}^*)\), esso deve necessariamente essere \(<0\) per la definitezza negativa dell'hessiana.
Conseguentemente si ha:
\[
\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a) \leq C(\mathbf{d}^*)\ a^2 + \omega(a)
\]
con \(C(\mathbf{d}^*)<0\).

A questo punto entra in gioco la proprietà del resto della formula di Taylor: infatti, dato che \( \omega(a)\) è infinitesimo d'ordine superiore ad \(a^2\) quando \(a\to 0\), in corrispondenza di \(\varepsilon = -C(\mathbf{d}^*) \) è certamente possibile determinare un \(r>0\) (ed ovviamente \(\leq R\)) tale che:
\[
| \omega(a)|<\varepsilon |a^2| \quad \Leftrightarrow \quad C(\mathbf{d}^*)\ a^2 <\omega(a)< -C(\mathbf{d}^*)\ a^2
\]
per ogni \(|a| \[
\begin{split}
\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a) &\leq C(\mathbf{d}^*)\ a^2 -C(\mathbf{d}^*)\ a^2 \\
&= 0
\end{split}
\]
è valida per ogni \(|a|3) e quindi \(f(x^*)\) è un massimo relativo.

***

Noto, inoltre, che la dimostrazione può essere usata per dire che nelle ipotesi poste il punto \(x^*\) è addirittura un massimo relativo proprio stretto, nel senso che esiste un intorno \(B(x^*;r)\) tale che la disuguaglianza:
\[
f(x) \]
valga in \(B(x^*;r)\setminus \{x^*\}\).

Infatti, nell'ultimo passaggio, in corrispondenza di \(\varepsilon =-\frac{C(\mathbf{d}^*)}{2}\) si può trovare \(r>0\) (e \(\leq R\)) tale che:
\[
|\omega (a)|< \varepsilon\ a^2\quad \Leftrightarrow\quad \frac{C(\mathbf{d}^*)}{2}\ a^2<\omega (a)<-\frac{C(\mathbf{d}^*)}{2}\ a^2\; .
\]
Ciò consente la maggiorazione:
\[
\begin{split}
\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a) &\leq C(\mathbf{d}^*)\ a^2 -\frac{C(\mathbf{d}^*)}{2}\ a^2 \\
&= \frac{C(\mathbf{d}^*)}{2}\ a^2
\end{split}
\]
con \(\frac{C(\mathbf{d}^*)}{2}<0\); cosicché la disuguaglianza \(f(x)-f(x^*)=f(x^*+a\mathbf{d})-f(x^*-0\mathbf{d})<0\) è vera per \(0<|a|

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.