Chiarimenti sul concetto di differenziale

Fab527
Salve, scrivo in quanto sono un po' (molto :-D ) confuso sul concetto di differenziale. Ho studiato che per determinare se una funzione a più variabili e a valori scalari è differenziabile posso sfruttare il teorema del differenziale totale (nel caso le derivate parziali esistano e siano continue), o posso verificare in un punto che questo limite $ lim_((x,y)->(x_0,y_0)) (f(x,y)-f(x_0,y_0)-[f_x(x_0,y_0),f_y(x_0,y_0)](x-x_0,y-y_0))/sqrt( (x-x_0)^2 +(y-y_0)^2 $ sia finito e tenda a zero. Se invece ho una funzione a più variabili e a valori vettoriali, faccio tutto ciò per ogni singola componente. Fin qui ok.

Ma qual'è di preciso il significato geometrico di differenziale? Io ho solo una vaga idea di "incremento infinitesimo in tutte le direzioni" analogo a quello di "incremento infinitesimo lungo la direzione delle ordinate" che si aveva in una variabile, ma non so se sia corretto e di sicuro non è molto preciso...e come si collegano a ciò i concetti di gradiente e matrice jacobiana?

Inoltre, quando mi viene chiesto di determinare il differenziale in uno specifico punto, come posso farlo?

Grazie in anticipo

Risposte
billyballo2123
In effetti, sebbene una volta appreso risulti ovvio, il concetto di differenziale merita parecchia attenzione. Scusa se mi permetto, ma riscrivo la definizione di funzione differenziabile in un punto con una notazione diversa:

Sia $f:A\to\mathbb{R}^m$, ove $A$ è un sottoinsieme aperto di $\mathbb{R}^n$. Dato $p_0\in A$, si dice che $f$ è differenziabile in $p_0$ se e solo se esiste un'applicazione lineare $L:\mathbb{R}^n\to\mathbb{R}^m$ tale che
\[
\lim_{p\to p_0}\frac{||f(p)-f(p_0)-L(p-p_0)||}{||p-p_0||}=0.
\]
L'applicazione lineare $L$ si chiama differenziale di $f$ nel punto $p_0$.

Dato che stiamo lavorando in dimensione finita, possiamo rappresentare l'applicazione lineare $L$ rispetto alla base canonica come una matrice $m\times n$, ad esempio
\[
M=
\begin{bmatrix}
m_{1,1} & \dots & m_{1,n} \\
\vdots & & \vdots \\
m_{m,1} & \dots & m_{m,n}
\end{bmatrix}
.
\]
Successivamente calcoleremo i coefficienti $\{m_{i,j}\}_{i,j}$.

Per rendere efficace l'interpretazione del "piano che approssima la funzione", restringiamoci al caso $n=2$ e $m=1$ (altrimenti sarebbe difficile immaginare il tutto :-D ). Dunque nel nostro caso $M$ è una matrice $1\times 2$, ovvero $M=[m_{1,1}\quad m_{1,2}]$ e il grafico di $f$ è una superficie immersa in $\mathbb{R}^3$.

Se vogliamo approssimare $f$ con un'altra particolare funzione, nel nostro caso un piano $\pi$, possiamo scrivere questa generica funzione (piano) come $z=ax+by+c$; se vogliamo che $\pi$ approssimi $f$ nel punto $p_0=(x_0,y_0)\in \mathbb{R}^2$, come minimo dobbiamo richiedere che $(x_0,y_0,f(p_0))=(x_0,y_0,ax_0+b_0+c)$, ovvero
\[
f(p_0)=ax_0+by_0+c.
\]

Se ora passiamo ad un generico punto $p=(x,y)\in A$, esisterà una certo errore $R$ tale che
\[
f(p)=ax+by+c+R,
\]
dunque
\[
f(p)-f(p_0)=a(x-x_0)+b(y-y_0)+R=[a\quad b](p-p_0)+R,
\]
o in altri termini
\[
f(p)-f(p_0)-[a\quad b](p-p_0)=R.
\]

Da quest'ultima equazione è chiaro che per qualunque coppia di coefficienti $a$ e $b$ si ha che
\[
\lim_{p\to p_0}|R|=\lim_{p\to p_0}|f(p)-f(p_0)-[a\quad b](p-p_0)|=0.
\]
Noi siamo però in cerca di quel particolare piano, definito dai coefficienti $a$ e $b$, che approssima $f$ in $p_0$ nel miglior modo possibile. Per questo, non solo richiediamo che $|R|\to 0$ per $p\to p_0$, ma anche che
\[
\lim_{p\to p_0}\frac{|R|}{||p-p_0||}=0,
\]
ovvero
\[
\lim_{p\to p_0}\frac{|f(p)-f(p_0)-[a\quad b](p-p_0)|}{||p-p_0||}=0.
\]

Se questi due coefficienti ($a$ e $b$) esistono, allora ponendo $m_{1,1}=a$ e $m_{1,2}=b$, la matrice $M$ è la matrice che rappresenta l'applicazione lineare $L$ della definizione di differenziabilità di $f$ nel punto $p_0$.

In questo senso quindi, trovare il differenziale di $f$ (l'applicazione lineare $L$ rappresentata da $M=[m_{1,1}\quad m_{1,2}]$), equivale a determinare il piano $\pi$ definito da $z=ax+by+c$ che meglio approssima il grafico di $f$ (notare che, determinati $a$ e $b$, il coefficiente $c$ si ricava dalla relazione $f(p_0)=ax_0+by_0+c$).

Se ora scegliamo $p=(x_0+t,y_0)$, otteniamo
\[
\begin{split}
0=&\lim_{p\to p_0}\frac{|f(p)-f(p_0)-L(p-p_0)|}{||p-p_0||} \\
=&\lim_{t\to 0}\bigg|\frac{f(x_0+t,y_0)-f(x_0,y_0)-L(t,0)}{t}\bigg| \\
=&\bigg|\lim_{t\to 0}\frac{|f(x_0+t,y_0)-f(x_0,y_0)-[m_{1,1}\quad m_{1,2}](t,0)|}{t}\bigg| \\
=&\bigg|\lim_{t\to 0}\frac{f(x_0+t,y_0)-f(x_0,y_0)}{t}-\lim_{t\to 0} \frac{t[m_{1,1}\quad m_{1,2}](1,0)}{t}\bigg| \\
=&\bigg|f_x(p_0)-m_{1,1}\bigg| \\
\end{split}
\]
ovvero $m_{1,1}=f_x(p_0)$, e analogamente $m_{1,2}=f_y(p_0)$.

Generalizzando con $n,m\in\mathbb{N}$, la matrice $M$ è data da
\[
M=
\begin{bmatrix}
f_{x_1}^1(p_0) & \dots & f_{x_n}^1(p_0) \\
\vdots & & \vdots \\
f_{x_1}^m(p_0) & \dots & f_{x_n}^m(p_0)
\end{bmatrix}.
\]

In conclusione, l'applicazione lineare $L$ in questione è rappresentata, rispetto alla base canonica, dalla matrice Jacobiana di $f$ calcolata nel punto $p_0$, dunque se vuoi trovare il differenziale di una funzione in un questo punto (cioè vuoi trovare $L$), ti basta calcolare la matrice Jacobiana di $f$ in $p_0$.

gio73
Ciao billy,
approfitto della tua pazienza per chiederti un chiarimento riguardo questo passaggio
"billyballo2123":


Se vogliamo approssimare il grafico di $f$ con un'altra particolare funzione, nel nostro caso un piano $\pi$, possiamo scrivere questa generica funzione (piano) come $z=ax+by+c$; se vogliamo che $\pi$ approssimi il grafico di $f$ nel punto $p_0=(p_0^x,p_0^y)\in \mathbb{R}^2$, come minimo dobbiamo richiedere che $(p_0^x,p_0^y,f(p_0))=(p_0^x,p_0^y,ap_0^x+bp_0^y+c)$, ovvero
\[
f(p_0)=ap_0^x+bp_0^y+c.
\]

Se ora passiamo ad un generico punto $p\in A$, esisterà una certo errore $R$ tale che
\[
f(p)=ap^x+bp^y+d+R,
\]
dunque
\[
f(p)-f(p_0)=a(p^x-p_0^x)+b(p^y-p_0^y)+R=[a\quad b](p-p_0)+R,
\]
o in altri termini
\[
f(p)-f(p_0)-[a\quad b](p-p_0)=R.
\]


Tu dici che esiste un piano di generica equazione $z=ax+by+c$, che approssima bene la nostra funzione nel punto $p_0$ (e nelle sue vicinanze?cioè $A$?), ovviamente questo piano deve passare per il punto $p_0$. Quindi piazzando le coordinate del punto $p_0$ nella nostra funzione e nel nostro piano dobbiamo ottenere lo stesso valore. Se poi ci allontaniamo un po', anche poco, dal punto $p_0$ e ci muoviamo nelle sue vicinanze ($A$), prendiamo un punto qualsiasi $pin A$ e sostituiamo le sue coordinate nella nostra funzione otterremo un certo valore, ma se le stesse coordinate del generico punto $p$ le mettiamo nel piano di prima otterremo un valore che si discosta un po', $R$, dal corrispondente valore della nostra funzione. Insomma c'è una certa differenza.
Fin qui ho capito bene?

billyballo2123
Innanzitutto ho corretto qualche errore che avevo fatto nel precedente messaggio (oltre ad aver cambiato la notazione perché mi sembrava veramente pesante).

"gio73":
Ciao billy,
approfitto della tua pazienza per chiederti un chiarimento riguardo questo passaggio
[...]
Tu dici che esiste un piano di generica equazione $z=ax+by+c$, che approssima bene la nostra funzione nel punto $p_0$ (e nelle sue vicinanze?cioè $A$?), ovviamente questo piano deve passare per il punto $p_0$. Quindi piazzando le coordinate del punto $p_0$ nella nostra funzione e nel nostro piano dobbiamo ottenere lo stesso valore. Se poi ci allontaniamo un po', anche poco, dal punto $p_0$ e ci muoviamo nelle sue vicinanze ($A$), prendiamo un punto qualsiasi $pin A$ e sostituiamo le sue coordinate nella nostra funzione otterremo un certo valore, ma se le stesse coordinate del generico punto $p$ le mettiamo nel piano di prima otterremo un valore che si discosta un po', $R$, dal corrispondente valore della nostra funzione. Insomma c'è una certa differenza.
Fin qui ho capito bene?


Non sono sicuro di aver capito il tuo dubbio, ma farò del mio meglio.

Dicendo che il piano approssima "bene" la funzione in un intorno di $p_0$, non significa che il suddetto piano approssimi la funzione in tutto l'aperto $A$! Mi spiego: nel calcolo eseguito nel messaggio precedente, abbiamo trovato il piano (le notazioni sono sempre ($p=(x,y)$ e $p_0=(x_0,y_0)$)
\[
\pi(p)=\pi(x,y)=f_x(p_0)x+f_y(p_0)y+f(p_0)-f_x(p_0)x_0-f_y(p_0)y_0.
\]
Bene, il significato della frase "$\pi$ approssima $f$" nel punto $p_0$ è che
\[
\lim_{p\to p_0}\frac{||f(p)-\pi(p)||}{||p-p_0||}=0
\]
(cioè che il piano e la funzione si assomiglino "parecchio" quando $p$ tende a $p_0$), infatti
\[
\begin{split}
f(p)-\pi(p)=&f(p)-f(p_0)-[f_x(p_0)\quad f_y(p_0)]
\begin{pmatrix}
x-x_0 \\
y-y_0
\end{pmatrix}
\\
=&f(p)-f(p_0)-[f_x(p_0)\quad f_y(p_0)](p-p_0) \\
=&f(p)-f(p_0)-L(p-p_0).
\end{split}
\]

Dunque se sappiamo che $f$ è differenziabile in $p_0$ e che ha differenziale $L$, per il calcolo sopra otteniamo
\[
\lim_{p\to p_0}\frac{||f(p)-\pi(p)||}{||p-p_0||}=\lim_{p\to p_0}\frac{||f(p)-f(p_0)-L(p-p_0)||}{||p-p_0||}=0.
\]

Fab527
Innanzitutto ti ringrazio billy, davvero una spiegazione eccezionale.

Però mi sono venute in mente un altro paio di cose da chiedere :o

1) Per funzioni $ f : mathbb(R) rarr mathbb(R) $ la derivata ha il compito di individuare il coefficiente angolare della retta tangente al grafico in un punto (retta che differisce dal grafico per un certo errore...): facendo le oppurtune correzioni dimensionali, in tal caso il differenziale coincide con la derivata???

2) Come si collega tutto ciò con la notazione (che viene usata in fisica) di $ df=f'(x)dx $ e di $ df=(partial f)/(partial x) dx+(partial f)/(partial y) dy+...+(partialf)/(partialn) dn $ ?

Grazie di nuovo

billyballo2123
1) Esattamente! Se $n=m=1$, allora $f$ è differenziabile in $p_0$ se e solo se è derivabile in $p_0$, e inoltre $L=df=f'(p_0)$.

2) La notazione $df=f'(x)dx$ può essere utile nel calcolo degli integrali (con il teorema del cambio di variabili). Così interpretata è però semplicemente un'uguaglianza formale, molto comoda per applicare suddetto teorema. Da punto di vista rigoroso non è molto profonda. La funzione $x$ ha come differenziale $dx=1$ dato che il differenziale è la sua derivata. Dunque dato che $df=f'(x)$ e $dx=1$, non è sbagliato scrivere $df=f'(x)dx$.
Per quanto riguarda l'espressione formale
\[
df=\frac{\partial f}{\partial x_1}dx_1+\ldots+\frac{\partial f}{\partial x_n}dx_n,
\]
sono formule che potresti capire una volta studiate le forme differenziali (in analisi 2, perché onestamente le spiegazioni che mi avevano dato in fisica 1 mi sembravano abbastanza naÏf)

Fab527
"billyballo2123":

2) La notazione $df=f'(x)dx$ può essere utile nel calcolo degli integrali (con il teorema del cambio di variabili). Così interpretata è però semplicemente un'uguaglianza formale, molto comoda per applicare suddetto teorema. Da punto di vista rigoroso non è molto profonda. La funzione $x$ ha come differenziale $dx=1$ dato che il differenziale è la sua derivata. Dunque dato che $df=f'(x)$ e $dx=1$, non è sbagliato scrivere $df=f'(x)dx$.


Ciò non equivale anche a fare il differenziale di una funzione $ f@ g $ dove $ f $ è una qualunque funzione di $ x $ e $ g(x)=x $ ? Perdonami se dico eresie :-D


"billyballo2123":
Per quanto riguarda l'espressione formale
\[
df=\frac{\partial f}{\partial x_1}dx_1+\ldots+\frac{\partial f}{\partial x_n}dx_n,
\]
sono formule che potresti capire una volta studiate le forme differenziali (in analisi 2, perché onestamente le spiegazioni che mi avevano dato in fisica 1 mi sembravano abbastanza naÏf)


Ok...allora forse tornerò a scrivere qui quando le farò :)

billyballo2123
"Fab527":

Ciò non equivale anche a fare il differenziale di una funzione $ f@ g $ dove $ f $ è una qualunque funzione di $ x $ e $ g(x)=x $ ? Perdonami se dico eresie :-D


Nessuna eresia!!! Le cose stanno esattamente così!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.