Matrice Jacobiana composizione di funzione
Vorrei dimostrare che date due funzioni
$f:A -> B$ e $g:B -> R^k$ con $A sube R^n, B sube R^m$, f differenziabile in $x_0$, g differenziabile in $y_0 = f(x_0)
$=> J_(g @ f)(x_0) = J_g(f(x_0)) * J_f(x_0)$
ma ahimè il mio testo non riporta la dimostrazione
Ho pensato di scrivere il differenziale per le due funzioni:
$f(x) = f(x_0) + J_f(x_0)(x - x_0) + o(|x - x_0|)$
$g(y) = g(y_0) + J_g(y_0)(y - y_0) + o(|y - y_0|) = g(f(x)) = g(f(x_0) + J_f(x_0)(x - x_0) + o(|x - x_0|))$
Ma ora non saprei come andare avanti.. qualche consiglio? O magari qualche anima pia con un testo che riporta la dimostrazione mi potebbe indicare la strada da percorrere? Ho provato a cercare anche in rete ma non ho trovato nulla
Grazie!
$f:A -> B$ e $g:B -> R^k$ con $A sube R^n, B sube R^m$, f differenziabile in $x_0$, g differenziabile in $y_0 = f(x_0)
$=> J_(g @ f)(x_0) = J_g(f(x_0)) * J_f(x_0)$
ma ahimè il mio testo non riporta la dimostrazione

Ho pensato di scrivere il differenziale per le due funzioni:
$f(x) = f(x_0) + J_f(x_0)(x - x_0) + o(|x - x_0|)$
$g(y) = g(y_0) + J_g(y_0)(y - y_0) + o(|y - y_0|) = g(f(x)) = g(f(x_0) + J_f(x_0)(x - x_0) + o(|x - x_0|))$
Ma ora non saprei come andare avanti.. qualche consiglio? O magari qualche anima pia con un testo che riporta la dimostrazione mi potebbe indicare la strada da percorrere? Ho provato a cercare anche in rete ma non ho trovato nulla

Grazie!
Risposte
Allora, per ipotesi g è differenziabile in $f(x_0)=y_0$, ovvero
$g(y)=g(y_0) + dg(y_0)(y-y_0) + w_1(y-y_0) |y-y_0|$
dove $dg(y_0)$ è il differenziale di g in $y_0$
f è differenziabile in $x_0$ ovvero
$f(x_0 + h) =f(x_0) + df(x_0)(h) + w_2(h)|h|$
Si ha $(g@f)(x) - (g@f)(x_0)= g(f(x)) - g(f(x_0))=$(dato che g è differenziabile)$ dg(y_0)(y-y_0) + w_1(y-y_0) |y-y_0|=$(dato che f è differenziabile)$dg(y_0)(df(x_0)(h) + w_2(h)|h|) + w_1(y-y_0) |y-y_0|=$(dato che il differenziale è un'applicazione lineare) $(dg(y_0)@df(x_0))(h) + w_3(h)|h|$
dove
$w_3(h) = dg(y_0)(w_2(h)) + w_1(y-y_0)|y-y_0|/|h|$
Basta vedere che $w_3(h) -> 0 $per $h->0$.
Se $h->0$ $w_2(h) -> 0$ , e quindi $dg(y_0)(w_2(h)) -> 0$ perchè l'applicazione $dg(y_0)$ è continua.
Studiamo $w_1(y-y_0)|y-y_0|/|h|=w_1(f(x_0 +h)-f(x_0))|f(x_0 +h)-f(x_0)|/|h|=w_1(f(x_0 +h)-f(x_0))|df(x_0)(h) + w_2(h)|h||/|h|$.
Sappiamo che $w_1(f(x_0 +h)-f(x_0)) -> 0$ per $h->0$.
$|df(x_0)(h) + w_2(h)|h||/|h|<=|df(x_0)(h)|/|h| + w_2(h)|h|=|df(x_0)(h/|h|)| + w_2(h)|h|<= |df(x_0)| +|w_2(h)|h|| ->|df(x_0)| $ per $h->0$
[Con $|df(x_0)|$ indico la norma dell'applicazione lineare differenziale ovvero: se ho T applicazione lineare da $R^n$ a $R^p$, definisco la sua norma così: |T|:= max{|T(h)| tale che h appartiene a $R^n$ e |h|=1}. Vedi nella dimostrazione che il vettore $h/|h|$ è proprio un versore e per come è definita la norma di un'applicazione lineare si ottiene la disuguaglianza che ho usato]
Abbiamo quindi dimostrato che l'applicazione $g@f$ è differenziabile in $x_0$ e il suo differenziale è la composizione dei differenziali, ovvero $d(g@f)(x_0)=dg(y_0)@df(x_0)$.
Di conseguenza visto che all'applicazione differenziale è associata la matrice Iacobiana, si ottiene ciò che volevi dimostrare.
Se non sono stata chiara chiedi pure!
Paola
$g(y)=g(y_0) + dg(y_0)(y-y_0) + w_1(y-y_0) |y-y_0|$
dove $dg(y_0)$ è il differenziale di g in $y_0$
f è differenziabile in $x_0$ ovvero
$f(x_0 + h) =f(x_0) + df(x_0)(h) + w_2(h)|h|$
Si ha $(g@f)(x) - (g@f)(x_0)= g(f(x)) - g(f(x_0))=$(dato che g è differenziabile)$ dg(y_0)(y-y_0) + w_1(y-y_0) |y-y_0|=$(dato che f è differenziabile)$dg(y_0)(df(x_0)(h) + w_2(h)|h|) + w_1(y-y_0) |y-y_0|=$(dato che il differenziale è un'applicazione lineare) $(dg(y_0)@df(x_0))(h) + w_3(h)|h|$
dove
$w_3(h) = dg(y_0)(w_2(h)) + w_1(y-y_0)|y-y_0|/|h|$
Basta vedere che $w_3(h) -> 0 $per $h->0$.
Se $h->0$ $w_2(h) -> 0$ , e quindi $dg(y_0)(w_2(h)) -> 0$ perchè l'applicazione $dg(y_0)$ è continua.
Studiamo $w_1(y-y_0)|y-y_0|/|h|=w_1(f(x_0 +h)-f(x_0))|f(x_0 +h)-f(x_0)|/|h|=w_1(f(x_0 +h)-f(x_0))|df(x_0)(h) + w_2(h)|h||/|h|$.
Sappiamo che $w_1(f(x_0 +h)-f(x_0)) -> 0$ per $h->0$.
$|df(x_0)(h) + w_2(h)|h||/|h|<=|df(x_0)(h)|/|h| + w_2(h)|h|=|df(x_0)(h/|h|)| + w_2(h)|h|<= |df(x_0)| +|w_2(h)|h|| ->|df(x_0)| $ per $h->0$
[Con $|df(x_0)|$ indico la norma dell'applicazione lineare differenziale ovvero: se ho T applicazione lineare da $R^n$ a $R^p$, definisco la sua norma così: |T|:= max{|T(h)| tale che h appartiene a $R^n$ e |h|=1}. Vedi nella dimostrazione che il vettore $h/|h|$ è proprio un versore e per come è definita la norma di un'applicazione lineare si ottiene la disuguaglianza che ho usato]
Abbiamo quindi dimostrato che l'applicazione $g@f$ è differenziabile in $x_0$ e il suo differenziale è la composizione dei differenziali, ovvero $d(g@f)(x_0)=dg(y_0)@df(x_0)$.
Di conseguenza visto che all'applicazione differenziale è associata la matrice Iacobiana, si ottiene ciò che volevi dimostrare.
Se non sono stata chiara chiedi pure!
Paola
Ti ringrazio per la mega risposta! 
Purtroppo a lezione non abbiamo affrontato i differenziali, e anche a causa di una differente notazione faccio un pò fatica a seguire, ma bene o male sono arrivato fino in fondo!
Comunque, proviamo a vedere...
In genere la differenziabilità sono abituato a scriverla così:
$g(y) = g(y_0) + J_g(y_0)(y - y_0) + o(|y - y_0|)
Quindi tu con $w_1(y-y_0) |y-y_0|$ indichi un o piccolo di $y - y_0$ ?
Se scrivessimo solo un o piccolo non semplificheremmo i calcoli successivamente?
Inoltre per quanto riguarda il diffrenziale ho cercato sul libro e vedo che viene definito come:
$df(x_0): h -> J_f(x_0)*h$
Quindi quando tu scrivi:
$dg(y_0)(y-y_0)$
se ho capito bene non indici la moltiplicazione, ma l'applicazione dell'operatore "differenziale" relativamente all'intervallo h ($(y - y_0)$) applicato nel punto $y_0$?
Composizione dei differenziali si traduce in prodotto delle Jacobiane?
Grazie ancora!

Purtroppo a lezione non abbiamo affrontato i differenziali, e anche a causa di una differente notazione faccio un pò fatica a seguire, ma bene o male sono arrivato fino in fondo!
Comunque, proviamo a vedere...
"prime_number":
Allora, per ipotesi g è differenziabile in $f(x_0)=y_0$, ovvero
$g(y)=g(y_0) + dg(y_0)(y-y_0) + w_1(y-y_0) |y-y_0|$
In genere la differenziabilità sono abituato a scriverla così:
$g(y) = g(y_0) + J_g(y_0)(y - y_0) + o(|y - y_0|)
Quindi tu con $w_1(y-y_0) |y-y_0|$ indichi un o piccolo di $y - y_0$ ?
Se scrivessimo solo un o piccolo non semplificheremmo i calcoli successivamente?
Inoltre per quanto riguarda il diffrenziale ho cercato sul libro e vedo che viene definito come:
$df(x_0): h -> J_f(x_0)*h$
Quindi quando tu scrivi:
$dg(y_0)(y-y_0)$
se ho capito bene non indici la moltiplicazione, ma l'applicazione dell'operatore "differenziale" relativamente all'intervallo h ($(y - y_0)$) applicato nel punto $y_0$?
"prime_number":
Abbiamo quindi dimostrato che l'applicazione $g@f$ è differenziabile in $x_0$ e il suo differenziale è la composizione dei differenziali, ovvero $d(g@f)(x_0)=dg(y_0)@df(x_0)$.
Composizione dei differenziali si traduce in prodotto delle Jacobiane?
Grazie ancora!
"Luca D.":
In genere la differenziabilità sono abituato a scriverla così:
$g(y) = g(y_0) + J_g(y_0)(y - y_0) + o(|y - y_0|)
Quindi tu con $w_1(y-y_0) |y-y_0|$ indichi un o piccolo di $y - y_0$ ?
Esatto, indico un o piccolo di $|y-y_0|$, ovvero un infinitesimo di ordine superiore, cioè che va a 0 in modo "più veloce" rispetto a $|y-y_0|$.
"Luca D.":
Inoltre per quanto riguarda il diffrenziale ho cercato sul libro e vedo che viene definito come:
$df(x_0): h -> J_f(x_0)*h$
Esatto.. Tu in pratica lo indichi con la matrice Jacobiana, io con una funzione lineare. E' la stessa cosa: c'è un teorema in algebra lineare che associa in modo biunivoco un'applicazione lineare ad una matrice.
"Luca D.":
Quindi quando tu scrivi:
$dg(y_0)(y-y_0)$
se ho capito bene non indici la moltiplicazione, ma l'applicazione dell'operatore "differenziale" relativamente all'intervallo h ($(y - y_0)$) applicato nel punto $y_0$?
Con $dg(y_0)$ indico la funzione, senza nessun argomento... Invece $dg(y_0)(y-y_0)$ sta ad indicare l'applicazione $dg(y_0)$ applicata al vettore $y-y_0$. Con la notazione della matrice Jacobiana avrei scritto $J_(g) (y_0) (y-y_0)$.
"Luca D.":
Composizione dei differenziali si traduce in prodotto delle Jacobiane?
Esatto..
In pratica io ho fatto vedere che il differenziale di $g@f$ in $x_0$ è la composizione dei differenziali di g e f rispettivamente in $y_0$ e $x_0$. Sempre per il Teorema che ti ho citato prima dato che c'è corrispondenza biunivoca tra differenziale e matrice jacobiana, questo equivale a dire la cosa del prodotto delle matrici.
Infatti, prendiamo un vettore h di $A$, il dominio di $g@f$.
Sappiamo secondo quel che ho dimostrato che $d(g@f)(x_0) (h)$ [ovvero il differenziale di $g@f$ rispetto a $x_0$ applicato in h]=$(dg(y_0) @ df(x_0))(h)=dg(y_0)(df(x_0)(h))$. Prima ti ho fatto vedere come si scrive in modo equivalente con la matrice Jacobiana. Facciamo la stessa cosa; si ha: $dg(y_0)(df(x_0)(h))=dg(y_0)( J_f (x_0)(h))= J_(g) (y_0) ( J_(f) (x_0)(h))= (J_(g) (y_0) J_(f) (x_0) )h = d(g@f)(x_0) (h)= J_(g@f) (x_0) h$ perchè il prodotto riga per colonna tra matrici è associativo.
Spero di non aver dato niente per scontato

Paola
Ok, grazie per i chiarimenti.
Ho provato a riformulare la dimostrazione senza utilizzare i differenziali e facendo uso degli "o piccoli".
$g(y) = g(y_0) + J_(g)(y_0)xx(y-y_0) + o(|y-y_0|)$
$f(y) = f(y_0) + J_(g)(x_0)xx(x-x_0) + o(|x-x_0|)$
$g(f(x)) - g(f(x_0)) = J_(g)(y_0)xx(y - y_0) + o(|y - y_0|) =$
$= J_(g)(y_0)xx[J_(g)(x_0)xx(x-x_0) + o(|x-x_0|)] + o(|y-y_0|) =$
$= J_(g)(y_0)xxJ_(g)(x_0)xx(x-x_0) + J_(g)(y_0)*o(|x-x_0|)+o(|y-y_0|)$
Guardando quest'ultima forma, "paragonandola" alla definizione di differenziabilità, e cioè:
$f(x) = f(x_0) + J_(f)(x_0)xx(x-x_0) + o(|x-x_0|)$
Possiamo concludere che: $J_(g)(y_0)*o(|x-x_0|)+o(|y-y_0|)$ deve essere un o piccolo di $x-x_0$ e di conseguenza:
$g(f(x)) = g(f(x_0)) + J_(g)(y_0)xxJ_(g)(x_0)xx(x-x_0) + J_(g)(y_0)*o(|x-x_0|)+o(|y-y_0|)$ ?
Grazie!
Ho provato a riformulare la dimostrazione senza utilizzare i differenziali e facendo uso degli "o piccoli".
$g(y) = g(y_0) + J_(g)(y_0)xx(y-y_0) + o(|y-y_0|)$
$f(y) = f(y_0) + J_(g)(x_0)xx(x-x_0) + o(|x-x_0|)$
$g(f(x)) - g(f(x_0)) = J_(g)(y_0)xx(y - y_0) + o(|y - y_0|) =$
$= J_(g)(y_0)xx[J_(g)(x_0)xx(x-x_0) + o(|x-x_0|)] + o(|y-y_0|) =$
$= J_(g)(y_0)xxJ_(g)(x_0)xx(x-x_0) + J_(g)(y_0)*o(|x-x_0|)+o(|y-y_0|)$
Guardando quest'ultima forma, "paragonandola" alla definizione di differenziabilità, e cioè:
$f(x) = f(x_0) + J_(f)(x_0)xx(x-x_0) + o(|x-x_0|)$
Possiamo concludere che: $J_(g)(y_0)*o(|x-x_0|)+o(|y-y_0|)$ deve essere un o piccolo di $x-x_0$ e di conseguenza:
$g(f(x)) = g(f(x_0)) + J_(g)(y_0)xxJ_(g)(x_0)xx(x-x_0) + J_(g)(y_0)*o(|x-x_0|)+o(|y-y_0|)$ ?
Grazie!
Secondo me il punto debole è qui: $J_(g)(y_0)*o(|x-x_0|)+o(|y-y_0|)$, perchè $J_(g)(y_0)*o(|x-x_0|)$ è il prodotto di una matrice ed un reale... Quindi il risultato è una matrice.. Non dovrebbe esserci una matrice nella formula di differenziabilità...
Paola
Paola
"prime_number":
Secondo me il punto debole è qui: $J_(g)(y_0)*o(|x-x_0|)+o(|y-y_0|)$, perchè $J_(g)(y_0)*o(|x-x_0|)$ è il prodotto di una matrice ed un reale... Quindi il risultato è una matrice.. Non dovrebbe esserci una matrice nella formula di differenziabilità...
Paola
Quindi dici che in questo modo non se ne esce? Il docente aveva proposto una soluzione del genere ma purtroppo ho degli appunti incompleti a riguardo e mi mancano dei passaggi

Comunque grazie per il supporto, se non ne esco mi imparo la tua dimostrazione con i differenziali!