Tante motivazioni per la definizione di derivata
\( \newcommand{\abs}[1]{\lvert{#1}\rvert} \)Con questo thread cero di farmi un po' di ordine sulla nozione di derivata. Voglio essenzialmente convincermi del fatto che le due costruzioni che seguono (o meglio, una e mezza, dato che l'altra non sono buono di farla) hanno come risultato lo stesso oggetto (che alla fine si vedrà essere quello che è comunemente chiamato "differenziale" di una funzione).
Incomincio parlando di funzioni reali di una variabile reale, ma chiaramente la speranza è che adattando opportunamente questi argomenti si riesca a motivare sufficientemente bene la definizione generale di differenziale (o derivata alla Fréchet) di funzioni tra spazi normati. Il motivo per cui questa definizione è così com'è non mi è davvero chiaro, e vorrei capirci di più.
Sia \( f\colon \mathbb R\to \mathbb R \) una funzione, e sia \( a\in \mathbb R \) un punto. Trovo ragionevole voler definire una funzione \( g\colon \mathbb R\to \mathbb R \) con le seguenti proprietà:
[list=3]
[*:2pdo4jds] è
\[
g(a) = f(a)\text{;}
\] [/*:m:2pdo4jds][*:2pdo4jds] la funzione \( T\colon \mathbb R\to \mathbb R \) di incremento definita ponendo \( T(\xi) = g(a + \xi) - g(a) \) per ogni \( \xi\in \mathbb R \) è una funzione lineare (e cioè, visto che siamo in dimensione \( 1 \), esiste una costante \( \alpha\in \mathbb R \) tale che \( T(\xi) = \alpha\xi \) per ogni \( \xi\in \mathbb R \));[/*:m:2pdo4jds]
[*:2pdo4jds] la differenza \( \abs{f - g} \) è un \( o \)-piccolo della funzione \( \abs{x - x_0} \) in \( a \), e cioè esiste e vale il limite
\[
\lim_{x\to a}\frac{\abs{f(x) - g(x)}}{\abs{x - a}} = 0\text{.}
\][/*:m:2pdo4jds][/list:o:2pdo4jds]
Se esiste, una tale funzione \( g \) non può che mappare
\[
g(x) = f(a) + T(x - a)
\] su ogni \( x\in \mathbb R \). In particolare, da questo discende che l'esistenza di una tale \( g \) è equivalente alla derivabilità in senso classico (cioè intesa come esistenza di un limite di un rapporto incrementale) della funzione \( f \) nel punto \( a \).
1. Veniamo al primo punto fondamentale della discussione. So che è vero che il grafico della funzione \( g \) ha tutto il diritto di potersi pensare come alla retta (affine) tangente al grafico della funzione \( f \) in \( a \). Perché?
Ora riesco a dirlo dato che \( f \) ha una sola variabile, e \( T \) è in questo caso la funzione che mappa \( \xi\mapsto f^\prime(a)\xi \), dove \( f^\prime(a) \) è il solito limite del rapporto incrementale. Ma nel caso in più variabili mi sembra meno ovvio convincermene, anche se probabilmente la colpa è mia, che non so fare i grafici di funzioni.
Vorrei anche verificare che il grafico \( \Gamma(G) \) di \( g \) è di fatto il traslato del sottospazio vettoriale \( \Gamma(T) = \{(x,T(x)) : x\in \mathbb R\} \) di \( \operatorname{dom}(g)\oplus\operatorname{cod}(g) = \mathbb R\oplus \mathbb R \) di vettore \( (a,f(a)) \):
\[
\Gamma(g) = \{(x,g(x)) : x\in \mathbb R\} = (a,f(a)) + \Gamma(T)\text{.}
\]
2. Se prima sono partito con l'idea di approssimare una funzione per mezzo di una \( g \) che ha proprietà e rappresentazione semplici (cioè con una \( g \) che è una funzione affine), un secondo modo per "far saltare fuori \( \lim_{h\to 0}(f(a + h)-f(a))/h \)" è di cercare esplicitamente un sottospazio di \( \mathbb R\oplus\mathbb R \) che possa dirsi "tangente" al grafico di \( f \). Il punto fondamentale, ora, è che se le cose vanno come credo debbano andare sarà proprio questo sottospazio a determinare una funzione lineare, diciamo \( T \), tale che la funzione \( g(x) = f(a) + T(x - a) \), \( x\in \mathbb R \), soddisfa a tutte le proprietà precedenti!
Ovviamente, adesso la difficoltà sta nel fatto che mentre è semplice costruire con gli strumenti dell'analisi funzioni, è difficile costruire esplicitamente oggetti geometrici -come dei sottospazi- senza prima definire delle funzioni "di supporto" delle quali suddetti oggetti geometrici sono il grafico (o il nucleo, o eccetera).
C'è un modo per costruire il, o motivare la forma del, sottospazio
\[
\{(x,f^\prime(a)x) : x\in \mathbb R\}\leqq \mathbb R\oplus\mathbb R
\] che non sia pensare a questo insieme come al grafico di una qualche \( f \)? (Che ne so, magari come "limite" di sottospazi, qualsiasi cosa significhi...).
---
Uno dei motivi per cui ho aperto queste discussioni è il modo in cui si motiva l'introduzione dei limiti dei rapporti incrementali nel (bellissimo) Calculus di M. Spivak. Dopo aver illustrato l'idea di arrivare alla retta tangente al grafico di una funzione \( f\colon \mathbb R\to \mathbb R \) nel punto \( a\in \mathbb R \) considerando le secanti che passano per \( (a,f(a)) \) e per un punto \( (x,f(x)) \) con \( x \) sempre più vicino ad \( a \), Spivak scrive
Questo non mi piace. Secondo me si fa una confusione bestiale tra rette affini/sottospazi (vettoriali), e funzioni che hanno per grafico rette affini/sottospazi, e rette affini/sottospazi che inducono funzioni affini/lineari che hanno per grafico rette affini/sottospazi. Dato che si sta parlando di analisi e che valgono i problemi dei quali ho parlato in 2 (tralasciando comunque che non so se questi problemi siano, da un punto di vista superiore, veri problemi, e se quindi esista una nozione di approssimazione di un sottoinsieme di \( \mathbb R^n \) con uno spazio vettoriale), nel thread vecchio proponevo che le derivate-come-limiti-di-rapporti-incrementali non fossero la prima cosa che si fa quando si inizia a parlare di calcolo differenziale.
Ora penso che si possa discutere la cosa con più serenità.
Incomincio parlando di funzioni reali di una variabile reale, ma chiaramente la speranza è che adattando opportunamente questi argomenti si riesca a motivare sufficientemente bene la definizione generale di differenziale (o derivata alla Fréchet) di funzioni tra spazi normati. Il motivo per cui questa definizione è così com'è non mi è davvero chiaro, e vorrei capirci di più.
Sia \( f\colon \mathbb R\to \mathbb R \) una funzione, e sia \( a\in \mathbb R \) un punto. Trovo ragionevole voler definire una funzione \( g\colon \mathbb R\to \mathbb R \) con le seguenti proprietà:
[list=3]
[*:2pdo4jds] è
\[
g(a) = f(a)\text{;}
\] [/*:m:2pdo4jds][*:2pdo4jds] la funzione \( T\colon \mathbb R\to \mathbb R \) di incremento definita ponendo \( T(\xi) = g(a + \xi) - g(a) \) per ogni \( \xi\in \mathbb R \) è una funzione lineare (e cioè, visto che siamo in dimensione \( 1 \), esiste una costante \( \alpha\in \mathbb R \) tale che \( T(\xi) = \alpha\xi \) per ogni \( \xi\in \mathbb R \));[/*:m:2pdo4jds]
[*:2pdo4jds] la differenza \( \abs{f - g} \) è un \( o \)-piccolo della funzione \( \abs{x - x_0} \) in \( a \), e cioè esiste e vale il limite
\[
\lim_{x\to a}\frac{\abs{f(x) - g(x)}}{\abs{x - a}} = 0\text{.}
\][/*:m:2pdo4jds][/list:o:2pdo4jds]
Se esiste, una tale funzione \( g \) non può che mappare
\[
g(x) = f(a) + T(x - a)
\] su ogni \( x\in \mathbb R \). In particolare, da questo discende che l'esistenza di una tale \( g \) è equivalente alla derivabilità in senso classico (cioè intesa come esistenza di un limite di un rapporto incrementale) della funzione \( f \) nel punto \( a \).
1. Veniamo al primo punto fondamentale della discussione. So che è vero che il grafico della funzione \( g \) ha tutto il diritto di potersi pensare come alla retta (affine) tangente al grafico della funzione \( f \) in \( a \). Perché?
Ora riesco a dirlo dato che \( f \) ha una sola variabile, e \( T \) è in questo caso la funzione che mappa \( \xi\mapsto f^\prime(a)\xi \), dove \( f^\prime(a) \) è il solito limite del rapporto incrementale. Ma nel caso in più variabili mi sembra meno ovvio convincermene, anche se probabilmente la colpa è mia, che non so fare i grafici di funzioni.
Vorrei anche verificare che il grafico \( \Gamma(G) \) di \( g \) è di fatto il traslato del sottospazio vettoriale \( \Gamma(T) = \{(x,T(x)) : x\in \mathbb R\} \) di \( \operatorname{dom}(g)\oplus\operatorname{cod}(g) = \mathbb R\oplus \mathbb R \) di vettore \( (a,f(a)) \):
\[
\Gamma(g) = \{(x,g(x)) : x\in \mathbb R\} = (a,f(a)) + \Gamma(T)\text{.}
\]
2. Se prima sono partito con l'idea di approssimare una funzione per mezzo di una \( g \) che ha proprietà e rappresentazione semplici (cioè con una \( g \) che è una funzione affine), un secondo modo per "far saltare fuori \( \lim_{h\to 0}(f(a + h)-f(a))/h \)" è di cercare esplicitamente un sottospazio di \( \mathbb R\oplus\mathbb R \) che possa dirsi "tangente" al grafico di \( f \). Il punto fondamentale, ora, è che se le cose vanno come credo debbano andare sarà proprio questo sottospazio a determinare una funzione lineare, diciamo \( T \), tale che la funzione \( g(x) = f(a) + T(x - a) \), \( x\in \mathbb R \), soddisfa a tutte le proprietà precedenti!
Ovviamente, adesso la difficoltà sta nel fatto che mentre è semplice costruire con gli strumenti dell'analisi funzioni, è difficile costruire esplicitamente oggetti geometrici -come dei sottospazi- senza prima definire delle funzioni "di supporto" delle quali suddetti oggetti geometrici sono il grafico (o il nucleo, o eccetera).
C'è un modo per costruire il, o motivare la forma del, sottospazio
\[
\{(x,f^\prime(a)x) : x\in \mathbb R\}\leqq \mathbb R\oplus\mathbb R
\] che non sia pensare a questo insieme come al grafico di una qualche \( f \)? (Che ne so, magari come "limite" di sottospazi, qualsiasi cosa significhi...).
---
Uno dei motivi per cui ho aperto queste discussioni è il modo in cui si motiva l'introduzione dei limiti dei rapporti incrementali nel (bellissimo) Calculus di M. Spivak. Dopo aver illustrato l'idea di arrivare alla retta tangente al grafico di una funzione \( f\colon \mathbb R\to \mathbb R \) nel punto \( a\in \mathbb R \) considerando le secanti che passano per \( (a,f(a)) \) e per un punto \( (x,f(x)) \) con \( x \) sempre più vicino ad \( a \), Spivak scrive
We have never before talked about a "limit" of lines, but we can talk about the limit of their slopes: the slope of the tangent line through \( (a,f(a)) \) should be
\[
\lim_{h\to 0}\frac{f(a + h) - f(a)}{h}\text{.}
\]
Questo non mi piace. Secondo me si fa una confusione bestiale tra rette affini/sottospazi (vettoriali), e funzioni che hanno per grafico rette affini/sottospazi, e rette affini/sottospazi che inducono funzioni affini/lineari che hanno per grafico rette affini/sottospazi. Dato che si sta parlando di analisi e che valgono i problemi dei quali ho parlato in 2 (tralasciando comunque che non so se questi problemi siano, da un punto di vista superiore, veri problemi, e se quindi esista una nozione di approssimazione di un sottoinsieme di \( \mathbb R^n \) con uno spazio vettoriale), nel thread vecchio proponevo che le derivate-come-limiti-di-rapporti-incrementali non fossero la prima cosa che si fa quando si inizia a parlare di calcolo differenziale.
Ora penso che si possa discutere la cosa con più serenità.
Risposte
"marco2132k":
1. Veniamo al primo punto fondamentale della discussione. So che è vero che il grafico della funzione \( g \) ha tutto il diritto di potersi pensare come alla retta (affine) tangente al grafico della funzione \( f \) in \( a \). Perché?
Ora riesco a dirlo dato che \( f \) ha una sola variabile, e \( T \) è in questo caso la funzione che mappa \( \xi\mapsto f^\prime(a)\xi \), dove \( f^\prime(a) \) è il solito limite del rapporto incrementale. Ma nel caso in più variabili mi sembra meno ovvio convincermene, anche se probabilmente la colpa è mia, che non so fare i grafici di funzioni.
Visto che non so se apprezzi i miei interventi


C'è una cosa che non ho capito, quando dici: "Nel caso di più variabili mi sembra meno ovvio convincermene", a cosa ti riferisci? A pensare , come dici, "il grafico della funzione $g$ come alla retta tangente in $a$"?
Se pensi però a una retta perciò non ti raccapezzi, perché l'esistenza del differenziale in funzioni di più variabili equivale all'esistenza del piano tangente, non di una retta.
Rileggerò comunque il tutto con calma, ci sono aspetti interessanti, ma al momento mi fermo qui, mi basta una sola martellata

Scherzo, eh?
No, ricino svbito! (Ma questa volta non ho detto nulla che si riferisse a te! hai le manie di persecuzione!
)
Se \( f\colon \mathbb R^2\to \mathbb R \) è una funzione e \( a\in \mathbb R^2 \) è un punto, e \( g\colon \mathbb R^2\to \mathbb R \) è una funzione che soddisfa a quelle tre richieste -opportunamente adattate- del post precedente, perché il suo grafico è il piano che può dirsi tangente al grafico di \( f \) in \( a \)?
Se \( f\colon \mathbb R^{\color{red}n}\to \mathbb R^{\color{red}m} \) è una funzione e \( a\in \mathbb R^n \) è un punto, e \( g\colon \mathbb R^n\to \mathbb R^m \) è una funzione che soddisfa a quelle tre richieste -opportunamente adattate- del post precedente, perché il suo grafico è il... il? che può dirsi tangente al grafico di \( f \) in \( a \)?
Nel primo caso c'è un argomento convincente che usa le derivate parziali di \( f \). Il problema (il quale, lo ridico, mi ha spinto a torturare la gente che passa per di qua con questi post), è che non capisco per quale motivo uno dovrebbe venire lì e dire "Bene, usiamo lo stesso aggettivo che si usa per indicare l'esistenza della derivata di una funzione \( \mathbb R\to \mathbb R \) quando esiste una lineare \( T \) tale che \( \lim_{x\to a}\frac{\lVert f(x) - f(a) - T(a)\rVert}{\lVert x - a\Vert} = 0 \)." È chiaro che non mi aspetto un disegno come risposta, ma un minimo di intuizione geometrica ci deve essere - e una risposta non è nemmeno, credo, il fatto che con questa definizione i teoremi del calcolo differenziale si generalizzano bene.

Se \( f\colon \mathbb R^2\to \mathbb R \) è una funzione e \( a\in \mathbb R^2 \) è un punto, e \( g\colon \mathbb R^2\to \mathbb R \) è una funzione che soddisfa a quelle tre richieste -opportunamente adattate- del post precedente, perché il suo grafico è il piano che può dirsi tangente al grafico di \( f \) in \( a \)?
Se \( f\colon \mathbb R^{\color{red}n}\to \mathbb R^{\color{red}m} \) è una funzione e \( a\in \mathbb R^n \) è un punto, e \( g\colon \mathbb R^n\to \mathbb R^m \) è una funzione che soddisfa a quelle tre richieste -opportunamente adattate- del post precedente, perché il suo grafico è il... il? che può dirsi tangente al grafico di \( f \) in \( a \)?
Nel primo caso c'è un argomento convincente che usa le derivate parziali di \( f \). Il problema (il quale, lo ridico, mi ha spinto a torturare la gente che passa per di qua con questi post), è che non capisco per quale motivo uno dovrebbe venire lì e dire "Bene, usiamo lo stesso aggettivo che si usa per indicare l'esistenza della derivata di una funzione \( \mathbb R\to \mathbb R \) quando esiste una lineare \( T \) tale che \( \lim_{x\to a}\frac{\lVert f(x) - f(a) - T(a)\rVert}{\lVert x - a\Vert} = 0 \)." È chiaro che non mi aspetto un disegno come risposta, ma un minimo di intuizione geometrica ci deve essere - e una risposta non è nemmeno, credo, il fatto che con questa definizione i teoremi del calcolo differenziale si generalizzano bene.
L'idea di Spivak (che è classica, che più classica non si può), si può rendere in maniera pressoché esatta giocando con le equazioni della retta. Vedi qui.
Che poi questa definizione di "oggetto lineare tangente" non sia comoda (perché non generalizzabile, a meno di bagni di sangue) è evidente; pertanto la definizione di "oggetto lineare tangente" viene data basandosi sull'idea dell'approssimazione a meno di infinitesimi d'ordine superiore. Vedi qui, Osservazione 4.
Che poi questa definizione di "oggetto lineare tangente" non sia comoda (perché non generalizzabile, a meno di bagni di sangue) è evidente; pertanto la definizione di "oggetto lineare tangente" viene data basandosi sull'idea dell'approssimazione a meno di infinitesimi d'ordine superiore. Vedi qui, Osservazione 4.