Gradiente ed Hessiano di una funzione contenente una norma

Tivo1
Salve a tutti, sono nuovo, innanzitutto volevo farvi i complimenti per l'aiuto che date ogni giorno a un sacco di studenti!
Spero che possiate aiutarmi con uno studio di funzione, in cui trovo dei calcoli che non riesco a completare:

$ f(x) = \|\|x - u\|\|^2 + \|\|x\|\| $

con $ x, u \in X $ spazio euclideo e $\|\|u\|\| = 1$

L'esercizio mi chiede di dire in quali punti esistono gradiente ed Hessiano e in quali il gradiente è uguale a zero.

Allora, prima di tutto ho riscritto la funzione in modo da semplificarla sfruttando l'ortonormalità di $u$:

$f(x) = \|\|x\|\|^2 -2 + \|\|u\|\|^2 + \|\|x\|\| = \|\|x\|\|^2 - 2 + 1 + \|\|x\|\|$

PS: con $$ in università indichiamo il prodotto scalare tra $x$ e $u$

Poi ho calcolato la derivata di $f(x)$ lungo la direzione $v$

$Df(x)v = 2 -2 + ()/\|\|x\|\|$

Sfruttando l'equazione $Df(x)v = < grad f(x), v>$ trovo che $grad f(x) = 2x - 2u + x/\|\|x\|\|$

E quindi il gradiente esiste in ogni $x != 0$ (o sbaglio?)
Il primo problema è trovare i punti in cui il gradiente è uguale a zero, dovrei risolvere l'equazione

$2x - 2u + x/\|\|x\|\| = 0$ ma come faccio a togliere di mezzo quella norma fastidiosa?



Il secondo problema riguarda l'Hessiano, che calcolo tramite l'equazione $D^2f(x)(v,w) = $

$D^2f(x)(v,w) = 2 + (\|\|x\|\| - ()/\|\|x\|\|)/(\|\|x\|\|^2) = 2 + ()/\|\|x\|\| - ()/(\|\|x\|\|^3) $

Quindi dovrei avere $Hf(x) = 2I + I/\|\|x\|\| $
e poi non so come completarlo! come trovo "l'hessiano" di $()/(\|\|x\|\|^3)$ ?
Io avevo pensato di "portare dentro" $$ nel secondo prodotto scalare ottenendo $(< x,v>)/\|\|x\|\|^3$ che praticamente è il prodotto scalare di $v$ per la proiezione di $w$ su $x$ divisa per $\|\|x\|\|$, ma non sono sicuro del ragionamento e dato che dopo l'esercizio mi chiede di calcolare lo spettro dell'Hessiano speravo in un'espressione più semplice...

Risposte
Rigel1
"Tivo":
Salve a tutti, sono nuovo, innanzitutto volevo farvi i complimenti per l'aiuto che date ogni giorno a un sacco di studenti!
Spero che possiate aiutarmi con uno studio di funzione, in cui trovo dei calcoli che non riesco a completare:

$ f(x) = \|\|x - u\|\|^2 + \|\|x\|\| $

con $ x, u \in X $ spazio euclideo e $\|\|u\|\| = 1$

L'esercizio mi chiede di dire in quali punti esistono gradiente ed Hessiano e in quali il gradiente è uguale a zero.

Allora, prima di tutto ho riscritto la funzione in modo da semplificarla sfruttando l'ortonormalità di $u$:

$f(x) = \|\|x\|\|^2 -2 + \|\|u\|\|^2 + \|\|x\|\| = \|\|x\|\|^2 - 2 + 1 + \|\|x\|\|$

PS: con $$ in università indichiamo il prodotto scalare tra $x$ e $u$

Poi ho calcolato la derivata di $f(x)$ lungo la direzione $v$

$Df(x)v = 2 -2 + ()/\|\|x\|\|$

Sfruttando l'equazione $Df(x)v = < grad f(x), v>$ trovo che $grad f(x) = 2x - 2u + x/\|\|x\|\|$

E quindi il gradiente esiste in ogni $x != 0$ (o sbaglio?)
Il primo problema è trovare i punti in cui il gradiente è uguale a zero, dovrei risolvere l'equazione

$2x - 2u + x/\|\|x\|\| = 0$ ma come faccio a togliere di mezzo quella norma fastidiosa?


Fai il prodotto scalare per \(x\) e per \(u\); ottieni così due equazioni.
Dalla prima ricava \(\langle x, u\rangle\) e sostituisci il valore nella seconda; ottieni un'equazione di secondo grado in \(\|x\|\) che ti permette di ricavare \(\|x\|\).
Sai poi che \(\|x-u\|=1/2\); penso che con queste informazioni dovresti riuscire a ricavare \(x\) (ma non ho fatto i conti...).

Tivo1
Grazie mille! Ho fatto i conti e ho trovato $\|\|x\|\| = -3/2$ e $\|\|x\|\| = 1/2$, da lì si trova facilmente che il gradiente si annulla in $x = (1/2)u$ e $x = (-3/2)u$

Per quanto riguarda l'Hessiano, sapresti darmi qualche suggerimento per calcolare l'ultimo termine?

Rigel1
Per l'hessiano, salvo errori, dovresti ottenere qualcosa del tipo
\[
D^2_{ij} f = \left(2 + \frac{1}{\|x\|}\right)\delta_{ij} - \frac{x_i x_j}{\|x\|^3}\,,
\]
vale a dire
\[
D^2 f = \left(2 + \frac{1}{\|x\|}\right) I - \frac{1}{\|x\|^3}\, x\otimes x\,.
\]

Tivo1
Solo un chiarimento: con $\otimes$ indichi il prodotto righe per colonne? In università non l'abbiamo mai visto...

Rigel1
"Tivo":
Solo un chiarimento: con $\otimes$ indichi il prodotto righe per colonne? In università non l'abbiamo mai visto...

Si chiama prodotto tensoriale. Se non l'hai visto, ha il significato scritto nella formula subito sopra. In generale, puoi identificare \(u\otimes v\) con la matrice \(A = (u_i v_j)\).

Tivo1
"Rigel":
[quote="Tivo"]Solo un chiarimento: con $\otimes$ indichi il prodotto righe per colonne? In università non l'abbiamo mai visto...

Si chiama prodotto tensoriale. Se non l'hai visto, ha il significato scritto nella formula subito sopra. In generale, puoi identificare \(u\otimes v\) con la matrice \(A = (u_i v_j)\).[/quote]

Tutto chiaro! Grazie ancora per l'aiuto e per la pazienza! :D

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.