Condizioni sufficienti del secondo ordine per un massimo
ciao a tutti!! spero di non sbagliare a postare la domanda.. io avrei bisogno di aiuto per una dimostrazione. il teorema è questo (condizione sufficiente per un massimo locale):
Sia f : X ⊆ R ^n → R,f ∈ C^2 (X), x*∈ X. Inoltre valgano le seguenti due condizioni:
- ∇f(x*)=0
- ∇^2 f(x* ) è definita negativa.
Allora x* è un punto di massimo locale per f.
Dimostrazione:
la formula di taylor arrestata al secondo ordine è:
f(x*+ αd )-f(x* )= αd' ∇f(x* )+1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
dove d è una qualsiasi direzione ammissibile che parte da x*. Per la prima condizione, αd' ∇f(x* )=0, quindi la formula diventa: f(x*+ αd )-f(x* )=1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
Dato che x* è un punto di massimo per ipotesi, f(x*+ αd )-f(x* )≤0 e quindi (data l'uguaglianza) anche il secondo membro deve essere ≤0.
1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)≤0
Essendo °(‖αd‖^2), per α che tende a 0, “un infinitesimo di ordine superiore” a ‖αd‖^2, °(‖αd‖^2) non influisce sul segno del secondo membro.Quindi 1/2 α^2d^T ∇^2 f(x* ) d≤0 e d^T ∇^2 f(x*) d≤0 , ∀d ∶d' ∇f(x* )=0 e ciò dimostra il teorema.
In sostanza la parte rossa non mi è chiara... ho trovato questa dimostrazione su un libro e la prof mi ha detto che non è precisa.. se qualcuno può aiutarmi mi sarebbe veramente di aiuto!!! o se qualcuno ha una dimostrazione a tale condizione diversa da quella che ho scritto io va bene lo stesso...
Sia f : X ⊆ R ^n → R,f ∈ C^2 (X), x*∈ X. Inoltre valgano le seguenti due condizioni:
- ∇f(x*)=0
- ∇^2 f(x* ) è definita negativa.
Allora x* è un punto di massimo locale per f.
Dimostrazione:
la formula di taylor arrestata al secondo ordine è:
f(x*+ αd )-f(x* )= αd' ∇f(x* )+1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
dove d è una qualsiasi direzione ammissibile che parte da x*. Per la prima condizione, αd' ∇f(x* )=0, quindi la formula diventa: f(x*+ αd )-f(x* )=1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
Dato che x* è un punto di massimo per ipotesi, f(x*+ αd )-f(x* )≤0 e quindi (data l'uguaglianza) anche il secondo membro deve essere ≤0.
1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)≤0
Essendo °(‖αd‖^2), per α che tende a 0, “un infinitesimo di ordine superiore” a ‖αd‖^2, °(‖αd‖^2) non influisce sul segno del secondo membro.Quindi 1/2 α^2d^T ∇^2 f(x* ) d≤0 e d^T ∇^2 f(x*) d≤0 , ∀d ∶d' ∇f(x* )=0 e ciò dimostra il teorema.
In sostanza la parte rossa non mi è chiara... ho trovato questa dimostrazione su un libro e la prof mi ha detto che non è precisa.. se qualcuno può aiutarmi mi sarebbe veramente di aiuto!!! o se qualcuno ha una dimostrazione a tale condizione diversa da quella che ho scritto io va bene lo stesso...
Risposte
aaaaah... va bene.. l'ho messo in minuscolo...
"ambrina1555":
Sia f : X ⊆ R ^n → R,f ∈ C^2 (X), x*∈ X. Inoltre valgano le seguenti due condizioni:
- ∇f(x*)=0
- ∇^2 f(x* ) è definita negativa.
Allora x* è un punto di massimo locale per f.
Dimostrazione:
la formula di taylor arrestata al secondo ordine è:
f(x*+ αd )-f(x* )= αd' ∇f(x* )+1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
dove d è una qualsiasi direzione ammissibile che parte da x*. Per la prima condizione, αd' ∇f(x* )=0, quindi la formula diventa: f(x*+ αd )-f(x* )=1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)
Dato che x* è un punto di massimo per ipotesi, f(x*+ αd )-f(x* )≤0 e quindi (data l'uguaglianza) anche il secondo membro deve essere ≤0.
1/2 α^2 d' ∇^2 f(x*) d+ °(‖αd‖^2)≤0
Essendo °(‖αd‖^2), per α che tende a 0, “un infinitesimo di ordine superiore” a ‖αd‖^2, °(‖αd‖^2) non influisce sul segno del secondo membro.Quindi 1/2 α^2d^T ∇^2 f(x* ) d≤0 e d^T ∇^2 f(x*) d≤0 , ∀d ∶d' ∇f(x* )=0 e ciò dimostra il teorema.
In sostanza la parte rossa non mi è chiara... ho trovato questa dimostrazione su un libro e la prof mi ha detto che non è precisa.. se qualcuno può aiutarmi mi sarebbe veramente di aiuto!!! o se qualcuno ha una dimostrazione a tale condizione diversa da quella che ho scritto io va bene lo stesso...
Vogliamo dimostrare che nelle ipotesi poste esiste una sferetta \(B(x^*;r)\) tale che:
\[
\tag{1}
f(x)\leq f(x^*)
\]
per \(x\in B(x^*;r)\).
Innanzitutto, visto che \(x^*\) è interno al dominio della \(f\), possiamo sempre scegliere un \(R>0\) tale che \(B(x^*;R)\) è tutta contenuta nel dominio di \(f\).
Per ogni fissato \(x\in B(x^*;R)\) possiamo altresì scrivere \(x=x^*+a\mathbf{d}\), con \(\mathbf{d}\) versore ed \(a\) scalare opportuni (in particolare \(\mathbf{d}\) è un versore dell'unica retta per \(x\) ed \(x^*\), ed \(a\) è il parametro che individua \(x\) su tale retta nell'equazione parametrica); in particolare, dato che \(\mathbf{d}\) è un versore, si ha \(\|x-x^*\|=\|(x^*+a\mathbf{d}) -x^*\|=|a|\|\mathbf{d}\|=|a|\), quindi si ha certamente \(|a|
\[\tag{2}
f(x^*+a\mathbf{d}) \leq f(x^*)
\]
vale per ogni versore \(\mathbf{d}\) e per ogni \(a\) sufficientemente vicino a \(0\), indipendentemente da \(\mathbf{d}\).
La funzione composta \(\phi (a):=f(x^*+a\mathbf{d})\) è definita almeno nell'intervallo \(]-R,R[\) ed è ivi derivabile due volte; quindi possiamo applicare la formula di Taylor al secondo ordine a \(\phi\) in \(0\) e trovare:
\[
\phi (a)=\phi(0) + \phi^\prime (0)\ a+\frac{1}{2}\ \phi^{\prime \prime} (0)\ a^2 + \omega(a)\; ,
\]
in cui \(\omega (a)=\text{o}(a^2)\).
Data la definizione di \(\phi\) e visto che vale il teorema di derivazione delle funzioni composte, si trova:
\[
\begin{split}
\phi (a) &=f(x^*+a\mathbf{d}) \\
\phi^\prime (a) &= \langle \nabla f(x^*+a\mathbf{d}), \mathbf{d}\rangle\\
\phi^{\prime \prime} (a) &= \langle \nabla^2 f(x^*+a\mathbf{d})\ \mathbf{d}, \mathbf{d}\rangle
\end{split}
\]
(qui \(\langle \cdot ,\cdot \rangle\) è il prodotto scalare di \(\mathbb{R}^N\)), cosicché la formula precedente si riscrive:
\[
\begin{split}
f(x^*+a\mathbf{d}) &= f(x^*) + \langle \nabla f(x^*), \mathbf{d}\rangle + \frac{1}{2} \langle \mathbf{d}, \nabla^2 f(x^*)\ \mathbf{d} \rangle\ a^2 + \omega(a)\\
&= f(x^*) + \frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a)\; ,
\end{split}
\]
ove si è tenuto presente che \(f(x^*+0\mathbf{d})=f(x^*)\) e \(\nabla f(x^*)=\mathbf{0}\).
Pertanto, mostrare la (2) equivale a mostrare che la disuguaglianza:
\[ \tag{3}
\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a)\leq 0
\]
vale per ogni versore \(\mathbf{d}\) e per ogni \(a\) sufficientemente vicino a \(0\), indipendentemente da \(\mathbf{d}\).
La funzione:
\[
\mathbf{d} \mapsto C(\mathbf{d}):=\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle
\]
(che fornisce il terzo coefficiente di Taylor nella formula precedente) definita su \(\mathbb{S}^{N-1}=\partial B(\mathbf{0};1)\) è ovunque negativa (perché la matrice hessiana è definita negativa) e continua. Dato che \(\mathbb{S}^{N-1}\) è compatto (poiché chiuso e limitato), \(C\) ha massimo assoluto e tal massimo è \(\leq 0\); d'altra parte, poiché tale massimo è certamente preso su una direzione \(\mathbf{d}^*\in \mathbb{S}^{N-1}\), i.e. \(\max C = C(\mathbf{d}^*)\), esso deve necessariamente essere \(<0\) per la definitezza negativa dell'hessiana.
Conseguentemente si ha:
\[
\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a) \leq C(\mathbf{d}^*)\ a^2 + \omega(a)
\]
con \(C(\mathbf{d}^*)<0\).
A questo punto entra in gioco la proprietà del resto della formula di Taylor: infatti, dato che \( \omega(a)\) è infinitesimo d'ordine superiore ad \(a^2\) quando \(a\to 0\), in corrispondenza di \(\varepsilon = -C(\mathbf{d}^*) \) è certamente possibile determinare un \(r>0\) (ed ovviamente \(\leq R\)) tale che:
\[
| \omega(a)|<\varepsilon |a^2| \quad \Leftrightarrow \quad C(\mathbf{d}^*)\ a^2 <\omega(a)< -C(\mathbf{d}^*)\ a^2
\]
per ogni \(|a|
\begin{split}
\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a) &\leq C(\mathbf{d}^*)\ a^2 -C(\mathbf{d}^*)\ a^2 \\
&= 0
\end{split}
\]
è valida per ogni \(|a|
***
Noto, inoltre, che la dimostrazione può essere usata per dire che nelle ipotesi poste il punto \(x^*\) è addirittura un massimo relativo proprio stretto, nel senso che esiste un intorno \(B(x^*;r)\) tale che la disuguaglianza:
\[
f(x)
valga in \(B(x^*;r)\setminus \{x^*\}\).
Infatti, nell'ultimo passaggio, in corrispondenza di \(\varepsilon =-\frac{C(\mathbf{d}^*)}{2}\) si può trovare \(r>0\) (e \(\leq R\)) tale che:
\[
|\omega (a)|< \varepsilon\ a^2\quad \Leftrightarrow\quad \frac{C(\mathbf{d}^*)}{2}\ a^2<\omega (a)<-\frac{C(\mathbf{d}^*)}{2}\ a^2\; .
\]
Ciò consente la maggiorazione:
\[
\begin{split}
\frac{1}{2} \langle \nabla^2 f(x^*)\ \mathbf{d}, \mathbf{d} \rangle\ a^2 + \omega(a) &\leq C(\mathbf{d}^*)\ a^2 -\frac{C(\mathbf{d}^*)}{2}\ a^2 \\
&= \frac{C(\mathbf{d}^*)}{2}\ a^2
\end{split}
\]
con \(\frac{C(\mathbf{d}^*)}{2}<0\); cosicché la disuguaglianza \(f(x)-f(x^*)=f(x^*+a\mathbf{d})-f(x^*-0\mathbf{d})<0\) è vera per \(0<|a|
Ciao! Sono il tuo Tutor AI, il compagno ideale per uno studio interattivo. Utilizzo il metodo maieutico per affinare il tuo ragionamento e la comprensione. Insieme possiamo:
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Il Tutor AI di Skuola.net usa un modello AI di Chat GPT.
Per termini, condizioni e privacy, visita la relativa pagina.
Per termini, condizioni e privacy, visita la relativa pagina.