Convessità e minimo
Ciao, amici!
Conosco la convessità di una funzione $f:RR^2\to RR$ e, come fattomi recentemente notare da alcuni gentilissimi e brillantissimi forumisti (non è che
: è la verità, sotto gli occhi di tutti), avendo essa definizione analoga in 2 o $n$ variabili, una funzione convessa ha necessariamente un minimo nei propri punti critici.
Data quindi una funzione convessa in $n$ variabili, definita quindi direi come una funzione tale che \(\forall \boldsymbol{x}_1,\boldsymbol{x}_2\in\text{dom}(f)\subset\mathbb{R}^n,\forall\lambda\in(0,1) \text{ }f(\boldsymbol{x}_2+\lambda(\boldsymbol{x}_1-\boldsymbol{x}_2))\leq f(\boldsymbol{x}_1)+\lambda(f(\boldsymbol{x}_1)-f(\boldsymbol{x}_2))\), con disuguaglianza stretta per la convessità in senso stretto, se essa è derivabile due volte, mi pare che si possa considerare la derivata seconda della restrizione di $f$ ad una generica retta di direzione \(\boldsymbol{h}\), che chiamo \(g(t)=f(\boldsymbol{x}+t\boldsymbol{h})\), che con qualche calcoletto mi sembra sia \(g''(t)=\boldsymbol{h}^T H_f(\boldsymbol{x}+t\boldsymbol{h})\boldsymbol{h}\), forma quadratica associata alla hessiana $H_f$ che dunque, affinché $f$ sia convessa, direi debba essere semidefinita positiva (definita positiva per la convessità in senso stretto): giusto? Questo è quindi sufficiente ad assicurare che ogni punto critico sia un minimo?
Ciò che mi causa dubbio è che il mio testo di analisi dice che, se la forma quadratica associata alla hessiana è semidefinita positiva in un punto, non può essere di massimo, ma solo di minimo o di sella, proposizione che, a rigor di logica, resterebbe comunque vera anche se il punto critico potesse essere solo di minimo e mai di sella, ma l'affermazione del mio libro mi confonde un po'... può essere questo punto critico della funzione convessa un punto di sella?
Grazie di cuore a tutti!!!
Conosco la convessità di una funzione $f:RR^2\to RR$ e, come fattomi recentemente notare da alcuni gentilissimi e brillantissimi forumisti (non è che

Data quindi una funzione convessa in $n$ variabili, definita quindi direi come una funzione tale che \(\forall \boldsymbol{x}_1,\boldsymbol{x}_2\in\text{dom}(f)\subset\mathbb{R}^n,\forall\lambda\in(0,1) \text{ }f(\boldsymbol{x}_2+\lambda(\boldsymbol{x}_1-\boldsymbol{x}_2))\leq f(\boldsymbol{x}_1)+\lambda(f(\boldsymbol{x}_1)-f(\boldsymbol{x}_2))\), con disuguaglianza stretta per la convessità in senso stretto, se essa è derivabile due volte, mi pare che si possa considerare la derivata seconda della restrizione di $f$ ad una generica retta di direzione \(\boldsymbol{h}\), che chiamo \(g(t)=f(\boldsymbol{x}+t\boldsymbol{h})\), che con qualche calcoletto mi sembra sia \(g''(t)=\boldsymbol{h}^T H_f(\boldsymbol{x}+t\boldsymbol{h})\boldsymbol{h}\), forma quadratica associata alla hessiana $H_f$ che dunque, affinché $f$ sia convessa, direi debba essere semidefinita positiva (definita positiva per la convessità in senso stretto): giusto? Questo è quindi sufficiente ad assicurare che ogni punto critico sia un minimo?
Ciò che mi causa dubbio è che il mio testo di analisi dice che, se la forma quadratica associata alla hessiana è semidefinita positiva in un punto, non può essere di massimo, ma solo di minimo o di sella, proposizione che, a rigor di logica, resterebbe comunque vera anche se il punto critico potesse essere solo di minimo e mai di sella, ma l'affermazione del mio libro mi confonde un po'... può essere questo punto critico della funzione convessa un punto di sella?
Grazie di cuore a tutti!!!
Risposte
E' sbagliato questo modo di fare. Se una funzione è convessa, allora ogni punto critico è un minimo: questo si dimostra SENZA usare le derivate, e sennò cosa ce ne faremmo della definizione di "funzione convessa"? Niente: ci basterebbe parlare di funzioni con la derivata seconda positiva.
E' anche brutto questo modo del tuo libro di parlare di "punto di sella" riferendosi ad un punto critico che non è un massimo e nemmeno un minimo. Il "punto di sella" vero e proprio è quel punto critico per cui la matrice Hessiana ha qualche autovalore strettamente positivo e qualche autovalore strettamente negativo. Una funzione di due variabili, Intorno ad un punto critico siffatto, ha un grafico molto simile al grafico di \(x^2-y^2\), che ricorda appunto la sella di un cavallo.
E comunque il problema non si pone. Prova a dimostrare direttamente, usando la sola definizione, che un punto critico di una funzione convessa è necessariamente un minimo.
E' anche brutto questo modo del tuo libro di parlare di "punto di sella" riferendosi ad un punto critico che non è un massimo e nemmeno un minimo. Il "punto di sella" vero e proprio è quel punto critico per cui la matrice Hessiana ha qualche autovalore strettamente positivo e qualche autovalore strettamente negativo. Una funzione di due variabili, Intorno ad un punto critico siffatto, ha un grafico molto simile al grafico di \(x^2-y^2\), che ricorda appunto la sella di un cavallo.
E comunque il problema non si pone. Prova a dimostrare direttamente, usando la sola definizione, che un punto critico di una funzione convessa è necessariamente un minimo.
Grazie di cuore, dissonance, mi hai aperto gli occhi!!!!! Se considerando la restrizione $g(t)$ di prima direi che, perché $f$ sia convessa nel dominio, se è derivabile una volta (condizione necessaria affinché abbia un punto critico), direi che, per ogni punto \(\boldsymbol{x}+t\boldsymbol{h},t\in(0,1)\) contenuto tra gli estremi del segmento -interamente nel dominio- \((\boldsymbol{x},\boldsymbol{x}+\boldsymbol{h})\), si debba avere che
\(g(t)\geq g(0)+g'(0)t\) che è lo stesso di \(f(\boldsymbol{x}+t\boldsymbol{h})\geq f(\boldsymbol{x})+\nabla f(\boldsymbol{x})·t\boldsymbol{h}\)
con disuguaglianza stretta per la convessità in senso stretto, disuguaglianza opposta (analogamente stretta oppure no) per la concavità (in senso stretto oppure lato). Dall'annullamento di \(\nabla f(\boldsymbol{x})\) quando \(\boldsymbol{x}\) è punto critico mi pare che segua immediatamente che i punti critici di una funzione concava (rispettivamente convessa) sono necessariamente di minimo (rispettivamente massimo), stretto se concava (convessa) in senso stretto. Quod magis est quam quod erat demonstrandum
. Spero di non aver scritto scemenze.
Per quanto riguarda funzioni derivabili due volte, quindi, se la hessiana è semidefinita positiva, il punto critico è di minimo, giusto?
Grazie di cuore di nuovo!!!
\(g(t)\geq g(0)+g'(0)t\) che è lo stesso di \(f(\boldsymbol{x}+t\boldsymbol{h})\geq f(\boldsymbol{x})+\nabla f(\boldsymbol{x})·t\boldsymbol{h}\)
con disuguaglianza stretta per la convessità in senso stretto, disuguaglianza opposta (analogamente stretta oppure no) per la concavità (in senso stretto oppure lato). Dall'annullamento di \(\nabla f(\boldsymbol{x})\) quando \(\boldsymbol{x}\) è punto critico mi pare che segua immediatamente che i punti critici di una funzione concava (rispettivamente convessa) sono necessariamente di minimo (rispettivamente massimo), stretto se concava (convessa) in senso stretto. Quod magis est quam quod erat demonstrandum

Per quanto riguarda funzioni derivabili due volte, quindi, se la hessiana è semidefinita positiva, il punto critico è di minimo, giusto?
Grazie di cuore di nuovo!!!
Ok sulla prima parte. La disuguaglianza
\[
f(x+th)\ge f(x)+\nabla f(x)\cdot (th) \]
ha una interpretazione geometrica molto vivida: ti dice che il grafico di \(f\) è al di sopra dell'iperpiano ad esso tangente in \((x, f(x))\).
Sull'ultimo pezzo invece non ci siamo:
\[
f(x+th)\ge f(x)+\nabla f(x)\cdot (th) \]
ha una interpretazione geometrica molto vivida: ti dice che il grafico di \(f\) è al di sopra dell'iperpiano ad esso tangente in \((x, f(x))\).
Sull'ultimo pezzo invece non ci siamo:
No. Prendi \(x\in \mathbb{R} \mapsto x^3\). Per \(x=0\) la matrice Hessiana è nulla e quindi semidefinita positiva.
Per quanto riguarda funzioni derivabili due volte, quindi, se la hessiana è semidefinita positiva, il punto critico è di minimo, giusto?
Grazie di nuovo!!!
Già... Se $f$ è derivabile due volte direi che comunque sia in senso lato convessa (concava) se e solo se \(g''(t)\geq 0\) (rispettivamente \(g''(t)\leq 0\)), con $g$ definita come sopra, su ogni segmento \((\boldsymbol{x},\boldsymbol{x}+\boldsymbol{h})\) del dominio. Dato che mi sembra \(g''(t)=\boldsymbol{h}^T H_f(\boldsymbol{x}+t\boldsymbol{h})\boldsymbol{h}\), forma quadratica associata alla hessiana $H_f$, direi che dunque, perché $f$ sia convessa (concava), debba essere \(H_f(\boldsymbol{x})\geq 0\) (rispettivamente non positiva) per ogni \(\boldsymbol{x}\) interno al dominio di $f$. Credo che il mio errore fosse dovuto al fatto che non tenuto ben presente la necessità di considerare la hessiana ovunque... così è giusto quello che ho detto?
$\aleph_2$ (aumentato l'indice
) grazie!!!
Già... Se $f$ è derivabile due volte direi che comunque sia in senso lato convessa (concava) se e solo se \(g''(t)\geq 0\) (rispettivamente \(g''(t)\leq 0\)), con $g$ definita come sopra, su ogni segmento \((\boldsymbol{x},\boldsymbol{x}+\boldsymbol{h})\) del dominio. Dato che mi sembra \(g''(t)=\boldsymbol{h}^T H_f(\boldsymbol{x}+t\boldsymbol{h})\boldsymbol{h}\), forma quadratica associata alla hessiana $H_f$, direi che dunque, perché $f$ sia convessa (concava), debba essere \(H_f(\boldsymbol{x})\geq 0\) (rispettivamente non positiva) per ogni \(\boldsymbol{x}\) interno al dominio di $f$. Credo che il mio errore fosse dovuto al fatto che non tenuto ben presente la necessità di considerare la hessiana ovunque... così è giusto quello che ho detto?
$\aleph_2$ (aumentato l'indice

Si, ok così.
Adesso mi è tutto chiaro. $\aleph_3$ grazie...
