$|\nabla f|(x) ="sup"_{y \ne x} \frac{[f(x)-f(y)]^+}{|x-y|}$

Paolo902
Problema - Parte I (Concorso di ammissione SNS) Data una funzione $f: \RR^n \to \RR$ convessa, di classe $C^1$, si mostri che
\[
\vert \nabla f \vert(x) = \sup_{y \ne x} \frac{[f(x)-f(y)]^+}{\vert x-y \vert}.
\]

Io sono terrorizzato dall'assoluta mancanza di idee. Non so da dove cominciare, a stento capisco il testo: il numeratore al secondo membro è la parte positiva, quindi il max tra $f(x)-f(y)$ e $0$. Da dove comincio? La definizione di gradiente la conosco e so calcolarne la sua norma, ma qui è buio pesto. Mi date un'idea per cominciare?

Grazie.

P.S. Come ho scritto sopra, questa è solo la prima parte dell'esercizio; ne seguiranno altre. Ho fatto questa precisazione perché magari qualche ipotesi (la convessità?!?) può essere inutile nello svolgimento di questo primo punto.

Risposte
j18eos
Io ti suggerisco di iniziare con l'ipotesi che \(f\) è di classe \(C^1\) in \(\mathbb{R}^n\) ed utilizzare un polinomio di Taylor in \(n\) variabili di grado \(1\); è pur sempre un inizio!

Paolo902
Ciao Armando,

grazie per la risposta. Sì, ovviamente avevo pensato a Taylor, viste le forti ipotesi di regolarità, ma non so bene come usarlo.
Fissiamo $x_0 \in \RR^{n}$: allora possiamo scrivere [tex]f(x)=f(x_0)+\langle \nabla f (x_0) , x-x_0 \rangle + o(\Vert x -x_0\Vert)[/tex]. Ma da qua la vedo dura ottenere quell'uguaglianza sulla norma del gradiente...

Tu che dici?

dissonance
@Armando: Non ti sei sforzato molto. ;-)

@Paolo: Se ti può consolare pure io non saprei da dove cominciare. Credo che il polinomio di Taylor che diceva Armando non ti porterà da nessuna parte, perché devi sfruttare l'ipotesi di convessità in qualche modo. Infatti, il risultato è falso se \(f\) non è convessa: prova per esempio con \(f(x)=x^3\) in \(x=0\). Hai che \(f'(0)=0\) ma
\[
\sup_{y \ne 0} \frac{(-y^3)^+}{\lvert y \rvert}=\sup_{y < 0} \frac{-y^3}{-y}=\sup_{y<0}\ y^2=+\infty.
\]

Prova a partire da \(n=1\), lì hai la grossa informazione che i rapporti incrementali sono crescenti, e questa mi pare una informazione utile per partire. Altrimenti potresti usare la disuguaglianza "il grafico della funzione convessa è al di sopra delle sue rette tangenti":
\[
f(y) \ge f'(x)(y-x)+f(x).\]

Vedi un po' cosa ne viene fuori.

dissonance
Ho corretto alcuni refusi nel post precedente.

Paolo902
Ottima osservazione sulla convessità, io non l'avevo proprio notato.

Ascolto il tuo consiglio e comincio con $n=1$: siccome la funzione "sta sopra le rette tangenti" posso scrivere che, fissato $x \in \RR$, per ogni $y \in \RR$ (con $y > x$) vale
\[
f'(x) \le \frac{f(y)-f(x)}{y-x}
\]
e quindi
\[
f'(x) \le \sup_{y>x} \frac{f(y)-f(x)}{y-x}
\]

In maniera del tutto analoga,
\[
f'(x) \ge \sup_{y \]

Però ho due grossi problemi: 1) non so dove tirare fuori il valore assoluto e soprattutto 2) non so da dove viene fuori quella dannata parte positiva. Tu hai idee?

Grazie per il tuo aiuto.

dissonance
Purtroppo non ho tempo di riflettere a fondo, butto giù qualche idea alla rinfusa sperando di essere di qualche aiuto.

1) Secondo me sei sulla buona strada, adesso quanto meno la dimostrazione inizia a prendere forma.
2) Non ci scordiamo che \(f\in C^1\), non è solo derivabile. In particolare, se \(f'(x)\) ha un segno (\(>0\) o \(<0\)), lo mantiene in tutto un intorno e quindi è monotona nello stesso. Perciò \((f(y)-f(x))^+\) è non nullo solo per \(y>x\) oppure \(y
Forse distinguendo i tre casi \(f'(x)>0, f'(x)=0, f'(x)<0\) arrivi da qualche parte.

totissimus
Provo a dimostrarlo:


j18eos
Spiego il mio tentativo, che non ho poi sviluppato ma che sono intenzionato a farlo; io mi sono posto subito una domanda: dova sta scritto che quell'estremo superiore sia finito nelle correnti ipotesi? Giuseppe dissonance si è "limitato" a mostrare che l'ipotesi della convessità è indispensabile.
Io ho pensato al polinomio di Taylor eppoi alla diseguaglianza di Cauchy-Schwarz per ottenere una stima dall'alto, poi lavorare con essa per ottenere l'eguaglianza... potrebbe funzionare?

Raptorista1
Reggetevi forte, un ingegnere si appresta a dire la sua sulla questione :-D

Partiamo dalla parte positiva: essa è il massimo tra zero ed il suo argomento, questo significa che basta trovare una \(y\) per cui l'argomento è positivo e, siccome stiamo cercando il sup di una quantità non negativa, potremo sbarazzarci della parte positiva.
Che una \(y\) del genere esista è quasi sempre vero, e ciò segue dall'ipotesi di convessità: chiedere che l'argomento della parte positiva sia positivo è equivalente a chiedere che esista una \(y\) tale che \(f(x) > f(y)\); questo accade perché, essendo la funzione convessa, essa è sempre maggiore del piano tangente in \(x\), ed è quindi chiaro che se per qualche direzione il piano "sale", per forza di cose dall'altra parte il piano "scende", e quindi da una parte o dall'altra ci sarà una \(y\) che fa al caso nostro. N.B. i concetti di "sale" e "scende" si possono rendere rigorosi appoggiandosi all'ipotesi di continuità di \(f\) e scegliendo un intorno abbastanza piccolo di \(x\) [credo]. L'affermazione è tuttavia falsa solo se \(x\) è un punto di minimo, ma in questo caso i dettagli si aggiustano facilmente.

Per riassumere quanto detto finora, grazie all'ipotesi di convessità possiamo dire che
\[
\sup_{y \ne x} \frac{[f(x) - f(y)]^+}{|x - y|} = \sup_{y \ne x} \frac{f(x) - f(y)}{|x - y|}.
\]

Passiamo ora al sup: l'idea è quella di far vedere che \(|\nabla f|(x) \ge \frac{f(x) - f(y)}{|x - y|}\) e poi di trovare una successione che faccia convergere il rapporto al gradiente.
Graficamente [i.e. sullo schizzo 1D che ho sotto il naso] mi è comodo guardare il vettore \(-\nabla f\) [tanto il modulo è lo stesso] ed a questo punto vedo che i punti \((x,f(x)),(y,f(y)),(y,f(x))\) formano un triangolo e che il rapporto \(\frac{f(x) - f(y)}{|x - y|}\) altro non è che [quello che nel piano chiamiamo] il coefficiente angolare della retta che passa per \((x,f(x)),(y,f(y))\). La convessità entra ora in gioco rendendo chiaro che questo rapporto non può superare il coefficiente angolare della retta a cui appartiene il gradiente, che dalla definizione di differenziale di funzione sappiamo essere \(\left|\frac{<\nabla f(x), y - x>}{|y - x|}\right|\) e che, guarda caso, fa saltar fuori dal guazzabuglio proprio
\[
\frac{f(x) - f(y)}{|y - x|} \le |\nabla f|(x).
\]

Ho troppa fame per fare l'ultimo punto, ma non sembra impossibile!

Spero di non aver detto castronerie, vado a cena!

j18eos
Probabilmente è questo il trucco; la mia idea mi garba, solo che devo controllare un particolare per giungere poi alla stessa conclusione.

Per quanto riguarda l'uguaglianza: mi sa che c'entrino le proprietà di esistenza dei punti critici delle funzioni convesse, oppure ricordo male? Oppure la locale lipschitzianità?

aizarg1
Ma la soluzione di totissimus è sbagilata ?

j18eos
Guarda, la dimostrazione mi sembra corretta ma comunque si limita a un caso particolare!

dissonance
@j18eos: Continui a non sforzarti molto, mi pare. In tutti questi post non hai mai messo giù nulla di concreto. Riguardo la dimostrazione di totissimus: perché si limita ad un caso particolare?

@aizarg: Secondo me la dimostrazione di totissimus è completa e corretta, a parte un piccolo, ininfluente, errore di segno qui:
[...]sostituendo nella (3)
\[
\displaystyle \nabla f(x\color{red}+\lambda \theta \nabla f(x))\cdot \frac{\nabla f(x)}{|\nabla f(x)|}=\frac{f(x)-f(y(\lambda))}{|x-y(\lambda)|}.\][...]

Provo a riassumere l'idea: dalla disuguaglianza "il grafico della funzione convessa è al di sopra dei suoi iperpiani tangenti" (che ha certamente un nome più appropriato), si ottiene
\begin{equation}\tag{1}
\sup_{x \ne y} \frac{[f(x)-f(y)]^+}{\lvert x-y\rvert} \le \lvert \nabla f(x)\rvert.
\end{equation}
Prendendo \(y\) lungo la direzione di massimo accrescimento di \(f\) e sufficientemente prossima ad \(x\) si dimostra che la disuguaglianza non può essere stretta.

@totissimus: Spero che la mia interpretazione sia corretta. La tua soluzione mi è piaciuta parecchio!

@Raptorista: Mi sa che il tuo approccio è la versione geometrica di quanto totissimus fa per via analitica. Mi sbaglio? Non ho letto approfonditamente il tuo post, ti dico la verità. :oops:

Raptorista1
@dissonance, totissimus, others: non so rispondere alla tua domanda perché non ho letto la dimostrazione di totissimus: \(\lambda, \theta, \varepsilon....\) Decisamente troppe lettere :D

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.