Convessità e minimo

DavideGenova1
Ciao, amici!
Conosco la convessità di una funzione $f:RR^2\to RR$ e, come fattomi recentemente notare da alcuni gentilissimi e brillantissimi forumisti (non è che :-({|= : è la verità, sotto gli occhi di tutti), avendo essa definizione analoga in 2 o $n$ variabili, una funzione convessa ha necessariamente un minimo nei propri punti critici.
Data quindi una funzione convessa in $n$ variabili, definita quindi direi come una funzione tale che \(\forall \boldsymbol{x}_1,\boldsymbol{x}_2\in\text{dom}(f)\subset\mathbb{R}^n,\forall\lambda\in(0,1) \text{ }f(\boldsymbol{x}_2+\lambda(\boldsymbol{x}_1-\boldsymbol{x}_2))\leq f(\boldsymbol{x}_1)+\lambda(f(\boldsymbol{x}_1)-f(\boldsymbol{x}_2))\), con disuguaglianza stretta per la convessità in senso stretto, se essa è derivabile due volte, mi pare che si possa considerare la derivata seconda della restrizione di $f$ ad una generica retta di direzione \(\boldsymbol{h}\), che chiamo \(g(t)=f(\boldsymbol{x}+t\boldsymbol{h})\), che con qualche calcoletto mi sembra sia \(g''(t)=\boldsymbol{h}^T H_f(\boldsymbol{x}+t\boldsymbol{h})\boldsymbol{h}\), forma quadratica associata alla hessiana $H_f$ che dunque, affinché $f$ sia convessa, direi debba essere semidefinita positiva (definita positiva per la convessità in senso stretto): giusto? Questo è quindi sufficiente ad assicurare che ogni punto critico sia un minimo?
Ciò che mi causa dubbio è che il mio testo di analisi dice che, se la forma quadratica associata alla hessiana è semidefinita positiva in un punto, non può essere di massimo, ma solo di minimo o di sella, proposizione che, a rigor di logica, resterebbe comunque vera anche se il punto critico potesse essere solo di minimo e mai di sella, ma l'affermazione del mio libro mi confonde un po'... può essere questo punto critico della funzione convessa un punto di sella?
Grazie di cuore a tutti!!!

Risposte
dissonance
E' sbagliato questo modo di fare. Se una funzione è convessa, allora ogni punto critico è un minimo: questo si dimostra SENZA usare le derivate, e sennò cosa ce ne faremmo della definizione di "funzione convessa"? Niente: ci basterebbe parlare di funzioni con la derivata seconda positiva.

E' anche brutto questo modo del tuo libro di parlare di "punto di sella" riferendosi ad un punto critico che non è un massimo e nemmeno un minimo. Il "punto di sella" vero e proprio è quel punto critico per cui la matrice Hessiana ha qualche autovalore strettamente positivo e qualche autovalore strettamente negativo. Una funzione di due variabili, Intorno ad un punto critico siffatto, ha un grafico molto simile al grafico di \(x^2-y^2\), che ricorda appunto la sella di un cavallo.

E comunque il problema non si pone. Prova a dimostrare direttamente, usando la sola definizione, che un punto critico di una funzione convessa è necessariamente un minimo.

DavideGenova1
Grazie di cuore, dissonance, mi hai aperto gli occhi!!!!! Se considerando la restrizione $g(t)$ di prima direi che, perché $f$ sia convessa nel dominio, se è derivabile una volta (condizione necessaria affinché abbia un punto critico), direi che, per ogni punto \(\boldsymbol{x}+t\boldsymbol{h},t\in(0,1)\) contenuto tra gli estremi del segmento -interamente nel dominio- \((\boldsymbol{x},\boldsymbol{x}+\boldsymbol{h})\), si debba avere che
\(g(t)\geq g(0)+g'(0)t\) che è lo stesso di \(f(\boldsymbol{x}+t\boldsymbol{h})\geq f(\boldsymbol{x})+\nabla f(\boldsymbol{x})·t\boldsymbol{h}\)
con disuguaglianza stretta per la convessità in senso stretto, disuguaglianza opposta (analogamente stretta oppure no) per la concavità (in senso stretto oppure lato). Dall'annullamento di \(\nabla f(\boldsymbol{x})\) quando \(\boldsymbol{x}\) è punto critico mi pare che segua immediatamente che i punti critici di una funzione concava (rispettivamente convessa) sono necessariamente di minimo (rispettivamente massimo), stretto se concava (convessa) in senso stretto. Quod magis est quam quod erat demonstrandum :wink:. Spero di non aver scritto scemenze.
Per quanto riguarda funzioni derivabili due volte, quindi, se la hessiana è semidefinita positiva, il punto critico è di minimo, giusto?
Grazie di cuore di nuovo!!!

dissonance
Ok sulla prima parte. La disuguaglianza
\[
f(x+th)\ge f(x)+\nabla f(x)\cdot (th) \]
ha una interpretazione geometrica molto vivida: ti dice che il grafico di \(f\) è al di sopra dell'iperpiano ad esso tangente in \((x, f(x))\).

Sull'ultimo pezzo invece non ci siamo:

Per quanto riguarda funzioni derivabili due volte, quindi, se la hessiana è semidefinita positiva, il punto critico è di minimo, giusto?
No. Prendi \(x\in \mathbb{R} \mapsto x^3\). Per \(x=0\) la matrice Hessiana è nulla e quindi semidefinita positiva.

DavideGenova1
Grazie di nuovo!!!
Già... Se $f$ è derivabile due volte direi che comunque sia in senso lato convessa (concava) se e solo se \(g''(t)\geq 0\) (rispettivamente \(g''(t)\leq 0\)), con $g$ definita come sopra, su ogni segmento \((\boldsymbol{x},\boldsymbol{x}+\boldsymbol{h})\) del dominio. Dato che mi sembra \(g''(t)=\boldsymbol{h}^T H_f(\boldsymbol{x}+t\boldsymbol{h})\boldsymbol{h}\), forma quadratica associata alla hessiana $H_f$, direi che dunque, perché $f$ sia convessa (concava), debba essere \(H_f(\boldsymbol{x})\geq 0\) (rispettivamente non positiva) per ogni \(\boldsymbol{x}\) interno al dominio di $f$. Credo che il mio errore fosse dovuto al fatto che non tenuto ben presente la necessità di considerare la hessiana ovunque... così è giusto quello che ho detto?
$\aleph_2$ (aumentato l'indice :wink: ) grazie!!!

dissonance
Si, ok così.

DavideGenova1
Adesso mi è tutto chiaro. $\aleph_3$ grazie... :D

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.