Hessiana funzione composta
la funzione è la seguente: $ f(x,y)=g(x^2+phi(x,y),y) $
con $u(x,y)=x^2+phi(x,y); v(x,y)=y $
devo trovare l'hessiana di questa funzione, solamente che ho qualche difficoltà con il calcolo delle derivate parziali seconde. Ad esempio con la regola della catena ho trovato che:
$ (partial f)/(partial y)= (partial g)/(partial u)(x^2+phi(x,y),y)\cdot (partial u)/(partial y)(x,y)+(partial g)/(partial v)(x^2+phi(x,y),y)\cdot (partial v)/(partial y)(x,y) $
$(partial f)/(partial y)= (partial g)/(partial u)(x^2+phi(x,y),y)\cdot (partial phi)/(partial y)(x,y)+(partial g)/(partial v)(x^2+phi(x,y),y)\cdot (1)$
ora nel calcolare $(partial^2 f)/(partial y^2)$ non capisco come applicare il teorema di derivazione della funzione composta, nonchè quello della derivazione del prodotto
con $u(x,y)=x^2+phi(x,y); v(x,y)=y $
devo trovare l'hessiana di questa funzione, solamente che ho qualche difficoltà con il calcolo delle derivate parziali seconde. Ad esempio con la regola della catena ho trovato che:
$ (partial f)/(partial y)= (partial g)/(partial u)(x^2+phi(x,y),y)\cdot (partial u)/(partial y)(x,y)+(partial g)/(partial v)(x^2+phi(x,y),y)\cdot (partial v)/(partial y)(x,y) $
$(partial f)/(partial y)= (partial g)/(partial u)(x^2+phi(x,y),y)\cdot (partial phi)/(partial y)(x,y)+(partial g)/(partial v)(x^2+phi(x,y),y)\cdot (1)$
ora nel calcolare $(partial^2 f)/(partial y^2)$ non capisco come applicare il teorema di derivazione della funzione composta, nonchè quello della derivazione del prodotto

Risposte
Beh, fin qui pare ok.
Vai avanti a derivare.
Vai avanti a derivare.
"gugo82":
Beh, fin qui pare ok.
Vai avanti a derivare.
spontaneamente mi verrebbe da comportarmi come avrei fatto in una sola variabile, ossia:
$ (partial^2 f)/(partial y^2)= (partial^2 g)/(partial u^2)(x^2+phi(x,y),y)\cdot (partial phi)/(partial y)(x,y)+(partial^2 phi)/(partial y^2)(x,y) \cdot (partial g)/(partial u)(x^2+phi(x,y),y)+ (partial^2 g)/(partial v^2)(x^2+phi(x,y),y) $
Ti manca qualcosa, tipo un quadrato vicino a $phi_y$ e qualche derivata mista.
Denotando coi pedici la derivazione, se $f_y = g_u * u_y + g_v$ allora $f_(y,y) = g_(u,u) * (u_y)^2 + g_(u,v) * u_y + g_u * u_(y,y) + g_(v,v)$.
Nella derivazione non c’è nulla di difficile, basta seguire bene le regole.
Denotando coi pedici la derivazione, se $f_y = g_u * u_y + g_v$ allora $f_(y,y) = g_(u,u) * (u_y)^2 + g_(u,v) * u_y + g_u * u_(y,y) + g_(v,v)$.
Nella derivazione non c’è nulla di difficile, basta seguire bene le regole.
"gugo82":
Ti manca qualcosa, tipo un quadrato vicino a $ phi_y $ e qualche derivata mista.
Denotando coi pedici la derivazione, se $ f_y = g_u * u_y + g_v $ allora $ f_(y,y) = g_(u,u) * (u_y)^2 + g_(u,v) * u_y + g_u * u_(y,y) + g_(v,v) $.
il punto è che sto cercando una spiegazione "intuitiva" di questa formula ma non riesco a trovarla, mi spiego meglio: su una dispensa ho trovato questo esempio. Sia
$ f : R^2 →R^2 $
$ z =(f1(x1, x2), f2(x1, x2)) $
$ g : R^2 → R, y = g(z) = g(z1, z2)$ allora
$ h = g o f : R^2 → R, y = h(x1, x2) $
$(partial h)/(partial x1)= (partialg)/(partial z1) \cdot (partialf1)/(partial x1) $
$ (partial h)/(partial x2)= (partialg)/(partial z2) \cdot (partialf2)/(partial x2) $
"Per rendersi conto a livello puramente intuitivo del senso delle formule indicate, esaminiamo
in dettaglio l’ultima. Essa si può leggere pensando che $h$ dipende da $ x2$ non direttamente, ma
attraverso le due f, $f1$ ed $f2$ , che sono state “sostituite” al posto delle due variabili della $g$: dunque
per derivare la $h$ rispetto a $ x2 $ dovrò derivare la $g$ rispetto alle sue due variabili e poi le due f, $ f1$
ed $f2 $, rispetto alla variabile interessata alla derivazione, cioè rispetto alla $ x2 $. "
Vorrei riuscire a darmi una spiegazione di questo genere anche nel caso delle derivate parziali seconde, forse così riuscirei a comprendere meglio quelle [highlight]regole[/highlight] ed applicarle come si deve. Seguendo la spiegazione citata prima mi viene facile capire questi due termini $ g_(u,u) * (u_y)^2 + g_(v,v) $ ma ho difficoltà con questi $ g_(u,v) * u_y + g_u * u_(y,y) $ e in particolare con il prodotto misto. Inoltre il mio prof aggiunge anche questo termine alla soluzione da te proposta: $ g_(v,u) * u_y $
Manca qualcosa.
Tanto per capirci, definiamo $h(x_1 , x_2) := g( f_1(x_1,x_2), f_2(x_1,x_2))$ e supponiamo che sia lecito applicare il Teorema di Derivazione della Funzione Composta: otteniamo:
\[
\begin{split}
\frac{\partial h}{\partial x_1} (x_1, x_2)&= \frac{\partial g}{\partial z_1} (f_1, f_2) \cdot \frac{\partial f_1}{\partial x_1} (x_1, x_2)+ \frac{\partial g}{\partial z_2} (f_1, f_2) \cdot \frac{\partial f_2}{\partial x_1} (x_1, x_2) \\
\frac{\partial h}{\partial x_2} (x_1, x_2) &= \frac{\partial g}{\partial z_1} (f_1, f_2) \cdot \frac{\partial f_1}{\partial x_2} (x_1, x_2) + \frac{\partial g}{\partial z_2} (f_1, f_2) \cdot \frac{\partial f_2}{\partial x_2} (x_1, x_2)
\end{split}
\]
che, se vuoi, puoi scrivere con la formula del gradiente:
\[
\begin{split}
\frac{\partial h}{x_1} &= \langle \nabla g (\mathbf{f}), \mathbf{f}_{x_1}\rangle \\
\frac{\partial h}{x_2} &= \langle \nabla g (\mathbf{f}), \mathbf{f}_{x_2}\rangle
\end{split}
\]
in cui \(\langle \cdot , \cdot \rangle\) denota prodotto scalare e $mathbf(f)_(x_k)$ il vettore delle derivate della funzione $mathbf(f) := (f_1, f_2)$ rispetto ad $x_k$.
Le derivate secondo si calcolano sempre col solito teorema, tenendo presente che le derivate seconde di $g$ “producono” ulteriori termini dovuti alla presenza di funzioni composte: ad esempio la derivata seconda pura rispetto ad $x_1$ di $h$ è:
\[
\begin{split}
\frac{\partial^2 h}{x_1^2} (x_1, x_2)&= \frac{\partial^2 g}{\partial z_1^2} (f_1, f_2) \cdot \left( \frac{\partial f_1}{\partial x_1} (x_1, x_2)\right)^2 + \frac{\partial^2 g}{\partial z_2 \partial z_1} (f_1, f_2) \cdot \frac{\partial f_2}{\partial x_1} (x_1, x_2) \cdot \frac{\partial f_1}{\partial x_1} \\
&\phantom{=} + \frac{\partial^2 g}{\partial z_1 \partial z_2} (f_1, f_2) \cdot \frac{\partial f_1}{\partial x_1} (x_1, x_2) \cdot \frac{\partial f_2}{\partial x_1} + \frac{\partial^2 g}{\partial z_2^2} (f_1, f_2) \cdot \left( \frac{\partial f_2}{\partial x_1} (x_1, x_2)\right)^2 \\
&\phantom{=} + \frac{\partial g}{\partial z_1} (f_1, f_2) \cdot \frac{\partial^2 f_1}{\partial x_1^2} (x_1, x_2) + \frac{\partial g}{\partial z_2} (f_1, f_2) \cdot \frac{\partial^2 f_2}{\partial x_1^2} (x_1, x_2)
\end{split}
\]
(in cui ho raggruppato nei primi quattro addendi la forma quadratica nelle derivate prime di $mathbf(f)$ e nei secondi due addendi la forma lineare nelle derivate seconde di $mathbf(f)$) e le altre tre si calcolano similmente.
Una formula sintetica potrebbe essere:
\[
\frac{\partial^2 h}{\partial x_1^2} = \langle \mathbf{f}_{x_1}\cdot Hg(\mathbf{f}) , \mathbf{f}_{x_1}\rangle + \langle \nabla g (\mathbf{f}), \mathbf{f}_{x_1,x_1}\rangle
\]
(in cui $H$ è la matrice hessiana e $*$ denota prodotto riga colonna), ma devi controllare se funziona.
P.S.: E comunque sì, avevo saltato un termine (perché mi ero perso una componente interna).
Tanto per capirci, definiamo $h(x_1 , x_2) := g( f_1(x_1,x_2), f_2(x_1,x_2))$ e supponiamo che sia lecito applicare il Teorema di Derivazione della Funzione Composta: otteniamo:
\[
\begin{split}
\frac{\partial h}{\partial x_1} (x_1, x_2)&= \frac{\partial g}{\partial z_1} (f_1, f_2) \cdot \frac{\partial f_1}{\partial x_1} (x_1, x_2)+ \frac{\partial g}{\partial z_2} (f_1, f_2) \cdot \frac{\partial f_2}{\partial x_1} (x_1, x_2) \\
\frac{\partial h}{\partial x_2} (x_1, x_2) &= \frac{\partial g}{\partial z_1} (f_1, f_2) \cdot \frac{\partial f_1}{\partial x_2} (x_1, x_2) + \frac{\partial g}{\partial z_2} (f_1, f_2) \cdot \frac{\partial f_2}{\partial x_2} (x_1, x_2)
\end{split}
\]
che, se vuoi, puoi scrivere con la formula del gradiente:
\[
\begin{split}
\frac{\partial h}{x_1} &= \langle \nabla g (\mathbf{f}), \mathbf{f}_{x_1}\rangle \\
\frac{\partial h}{x_2} &= \langle \nabla g (\mathbf{f}), \mathbf{f}_{x_2}\rangle
\end{split}
\]
in cui \(\langle \cdot , \cdot \rangle\) denota prodotto scalare e $mathbf(f)_(x_k)$ il vettore delle derivate della funzione $mathbf(f) := (f_1, f_2)$ rispetto ad $x_k$.
Le derivate secondo si calcolano sempre col solito teorema, tenendo presente che le derivate seconde di $g$ “producono” ulteriori termini dovuti alla presenza di funzioni composte: ad esempio la derivata seconda pura rispetto ad $x_1$ di $h$ è:
\[
\begin{split}
\frac{\partial^2 h}{x_1^2} (x_1, x_2)&= \frac{\partial^2 g}{\partial z_1^2} (f_1, f_2) \cdot \left( \frac{\partial f_1}{\partial x_1} (x_1, x_2)\right)^2 + \frac{\partial^2 g}{\partial z_2 \partial z_1} (f_1, f_2) \cdot \frac{\partial f_2}{\partial x_1} (x_1, x_2) \cdot \frac{\partial f_1}{\partial x_1} \\
&\phantom{=} + \frac{\partial^2 g}{\partial z_1 \partial z_2} (f_1, f_2) \cdot \frac{\partial f_1}{\partial x_1} (x_1, x_2) \cdot \frac{\partial f_2}{\partial x_1} + \frac{\partial^2 g}{\partial z_2^2} (f_1, f_2) \cdot \left( \frac{\partial f_2}{\partial x_1} (x_1, x_2)\right)^2 \\
&\phantom{=} + \frac{\partial g}{\partial z_1} (f_1, f_2) \cdot \frac{\partial^2 f_1}{\partial x_1^2} (x_1, x_2) + \frac{\partial g}{\partial z_2} (f_1, f_2) \cdot \frac{\partial^2 f_2}{\partial x_1^2} (x_1, x_2)
\end{split}
\]
(in cui ho raggruppato nei primi quattro addendi la forma quadratica nelle derivate prime di $mathbf(f)$ e nei secondi due addendi la forma lineare nelle derivate seconde di $mathbf(f)$) e le altre tre si calcolano similmente.
Una formula sintetica potrebbe essere:
\[
\frac{\partial^2 h}{\partial x_1^2} = \langle \mathbf{f}_{x_1}\cdot Hg(\mathbf{f}) , \mathbf{f}_{x_1}\rangle + \langle \nabla g (\mathbf{f}), \mathbf{f}_{x_1,x_1}\rangle
\]
(in cui $H$ è la matrice hessiana e $*$ denota prodotto riga colonna), ma devi controllare se funziona.
P.S.: E comunque sì, avevo saltato un termine (perché mi ero perso una componente interna).
penso di aver compreso, calcolo la derivata parziale seconda mista:
$(partial^2 f)/(partial x_2partial x_1 ) =(partial^2 g)/(partial z_1^2)\cdot (partial f_1)/(partial x_2)\cdot(partial f_1)/(partial x_1) + (partial ^2g)/(partial z_1 partial z_2)\cdot (partial f_1)/(partial x_2) \cdot(partial f_2)/(partial x_1) +(partial ^2g)/(partial z_2 partial z_1)\cdot (partial f_2)/(partial x_2) \cdot (partial f_1)/(partial x_1)+ (partial^2 g)/(partial z_2^2)\cdot (partial f_2)/(partial x_2)\cdot (partial f_2)/(partial x_1)+ (partial g)/(partial z_1)\cdot (partial f_1^2)/(partial x_2 partial x_1)+ (partial g)/(partial z_2)\cdot (partial^2 f_2)/(partial x_2 partial x_1) $
E' corretto?
$(partial^2 f)/(partial x_2partial x_1 ) =(partial^2 g)/(partial z_1^2)\cdot (partial f_1)/(partial x_2)\cdot(partial f_1)/(partial x_1) + (partial ^2g)/(partial z_1 partial z_2)\cdot (partial f_1)/(partial x_2) \cdot(partial f_2)/(partial x_1) +(partial ^2g)/(partial z_2 partial z_1)\cdot (partial f_2)/(partial x_2) \cdot (partial f_1)/(partial x_1)+ (partial^2 g)/(partial z_2^2)\cdot (partial f_2)/(partial x_2)\cdot (partial f_2)/(partial x_1)+ (partial g)/(partial z_1)\cdot (partial f_1^2)/(partial x_2 partial x_1)+ (partial g)/(partial z_2)\cdot (partial^2 f_2)/(partial x_2 partial x_1) $
E' corretto?
