Operatori differenziali & Cambi di coordinate
Nel mio testo di fisica si operano i cambiamenti di coordinate con dei metodi un po' naïf.
Sono alla ricerca di un metodo più solido e rigoroso per ricavare l'espressione degli operatori differenziali gradiente, divergenza e rotore in coordinate differenti da quelle cartesiane. Ho trovato questa vecchia discussione che a livello teorico mi ha dato qualche spunto ma a livello pratico nulla.
Scegliamo come caso guida quello più semplice: vogliamo calcolare il gradiente di una funzione scalare $U: RR^3 \mapsto RR$ in coordinate sferiche.
Abbiamo dunque una funzione $U(x,y,z)$ di cui il gradiente sappiamo vale:
\[ \nabla U = \left( \frac{\partial U}{\partial x}, \frac{\partial U}{\partial y}, \frac{\partial U}{\partial z} \right) \]
Ora operiamo il cambio di coordinate:
\[ \mathbf{\Phi} (\rho,\theta,\phi) = \left( \rho \cos(\theta) \sin(\phi), \ \rho \sin(\theta) \sin(\phi), \ \rho \cos(\phi) \right) \]
Definendo:
\[\tilde{U} := U \circ \mathbf{\Phi} \]
ovvero:
\[\tilde{U} (\rho,\theta,\phi) = U(\mathbf{\Phi} (\rho,\theta,\phi)) \]
E ora:
\[ \nabla \tilde{U} = \ ?\]
Come si può procedere senza scomodare i metodi scimmieschi (citando Patrone
) tipici dei fisici?
La palla a voi
Sono alla ricerca di un metodo più solido e rigoroso per ricavare l'espressione degli operatori differenziali gradiente, divergenza e rotore in coordinate differenti da quelle cartesiane. Ho trovato questa vecchia discussione che a livello teorico mi ha dato qualche spunto ma a livello pratico nulla.
Scegliamo come caso guida quello più semplice: vogliamo calcolare il gradiente di una funzione scalare $U: RR^3 \mapsto RR$ in coordinate sferiche.
Abbiamo dunque una funzione $U(x,y,z)$ di cui il gradiente sappiamo vale:
\[ \nabla U = \left( \frac{\partial U}{\partial x}, \frac{\partial U}{\partial y}, \frac{\partial U}{\partial z} \right) \]
Ora operiamo il cambio di coordinate:
\[ \mathbf{\Phi} (\rho,\theta,\phi) = \left( \rho \cos(\theta) \sin(\phi), \ \rho \sin(\theta) \sin(\phi), \ \rho \cos(\phi) \right) \]
Definendo:
\[\tilde{U} := U \circ \mathbf{\Phi} \]
ovvero:
\[\tilde{U} (\rho,\theta,\phi) = U(\mathbf{\Phi} (\rho,\theta,\phi)) \]
E ora:
\[ \nabla \tilde{U} = \ ?\]
Come si può procedere senza scomodare i metodi scimmieschi (citando Patrone

La palla a voi

Risposte
La risposta alla tua domanda sta nel teorema di derivazione delle funzioni composte, il quale assicura che:
\[
\nabla \tilde{U} = J_\Phi\cdot \nabla U(\Phi)\; ,
\]
in cui \(J_\Phi\) è la matrice jacobiana e \(\cdot\) il prodotto riga-colonna.
Per dimostrare questa cosa basta fare due contarielli, quindi semplifichiamo ulteriormente mettendoci nel caso di due variabili.
Chiamiamo \(u(x,y)\) una funzione "sufficientemente buona", \(\Phi(r,\theta) = (r\ \cos \theta, r\ \sin \theta)\) il classico cambiamento di coordinate polari e poniamo \(U(r,\theta) := u\circ\Phi(r,\theta) = u(r\ \cos \theta, r\ \sin \theta)\).
Chiaramente anche la \(U\) è "sufficientemente buona" se ci teniamo lontani dal polo \((0,0)\), ossia se \(r>0\), e si ha:
\[
\begin{split}
U_r (r,\theta) &= \cos \theta\ u_x(r\ \cos \theta, r\ \sin \theta) + \sin \theta\ u_y(r\ \cos \theta, r\ \sin \theta)\\
U_\theta(r,\theta) &=(-r\ \sin \theta)\ u_x(r\ \cos \theta, r\ \sin \theta) + (r\ \cos \theta)\ u_y(r\ \cos \theta, r\ \sin \theta)\; .
\end{split}
\]
Tuttavia, di solito non è questo il problema che si incontra nella pratica matematica/fisica/ingegneristica, quanto piuttosto il seguente:
in altre parole, si vuole sostituire \(\nabla u\) con un vettore le cui componenti contengano le componenti di \(\nabla U\), che è il gradiente (della stessa "vera" funzione!) espresso in un altro sistema di coordinate.
Se la trasformazione di variabili è invertibile, allora non è difficile verificare che:
\[
\nabla u = J_{\Phi^{-1}}\cdot \nabla U (\Phi^{-1}) = J_\Phi^{-1}(\Phi^{-1})\cdot \nabla U(\Phi^{-1})\; ;
\]
nell'esempio precedente, usando la regola di Cramer si ricava:
\[
\begin{split}
u_x &= \frac{1}{r}\ \left( U_r\ r\ \cos \theta - U_\theta\ \sin \theta\right)\\
u_y &= \frac{1}{r}\ \left( U_r\ r\ \sin \theta - U_\theta\ \cos \theta\right)
\end{split}
\]
intorno ai punti in cui la trasformazione di coordinate è invertibile ed in cui deve porsi \(r=r(x,y)\) e \(\theta = \theta (x,y)\), i secondi membri essendo le componenti di \(\Phi^{-1} (x,y)\).
\[
\nabla \tilde{U} = J_\Phi\cdot \nabla U(\Phi)\; ,
\]
in cui \(J_\Phi\) è la matrice jacobiana e \(\cdot\) il prodotto riga-colonna.
Per dimostrare questa cosa basta fare due contarielli, quindi semplifichiamo ulteriormente mettendoci nel caso di due variabili.
Chiamiamo \(u(x,y)\) una funzione "sufficientemente buona", \(\Phi(r,\theta) = (r\ \cos \theta, r\ \sin \theta)\) il classico cambiamento di coordinate polari e poniamo \(U(r,\theta) := u\circ\Phi(r,\theta) = u(r\ \cos \theta, r\ \sin \theta)\).
Chiaramente anche la \(U\) è "sufficientemente buona" se ci teniamo lontani dal polo \((0,0)\), ossia se \(r>0\), e si ha:
\[
\begin{split}
U_r (r,\theta) &= \cos \theta\ u_x(r\ \cos \theta, r\ \sin \theta) + \sin \theta\ u_y(r\ \cos \theta, r\ \sin \theta)\\
U_\theta(r,\theta) &=(-r\ \sin \theta)\ u_x(r\ \cos \theta, r\ \sin \theta) + (r\ \cos \theta)\ u_y(r\ \cos \theta, r\ \sin \theta)\; .
\end{split}
\]
Tuttavia, di solito non è questo il problema che si incontra nella pratica matematica/fisica/ingegneristica, quanto piuttosto il seguente:
Se ho un problema in cui figura \(\nabla u(x,y)\) ed in cui sembra conveniente rappresentare le variabili non già come coordinate rettangolari cartesiane, ma come coordinate di altro tipo, cosa devo sostituire alle componenti di \(\nabla u(x,y)\) per far tornare i conti?
in altre parole, si vuole sostituire \(\nabla u\) con un vettore le cui componenti contengano le componenti di \(\nabla U\), che è il gradiente (della stessa "vera" funzione!) espresso in un altro sistema di coordinate.
Se la trasformazione di variabili è invertibile, allora non è difficile verificare che:
\[
\nabla u = J_{\Phi^{-1}}\cdot \nabla U (\Phi^{-1}) = J_\Phi^{-1}(\Phi^{-1})\cdot \nabla U(\Phi^{-1})\; ;
\]
nell'esempio precedente, usando la regola di Cramer si ricava:
\[
\begin{split}
u_x &= \frac{1}{r}\ \left( U_r\ r\ \cos \theta - U_\theta\ \sin \theta\right)\\
u_y &= \frac{1}{r}\ \left( U_r\ r\ \sin \theta - U_\theta\ \cos \theta\right)
\end{split}
\]
intorno ai punti in cui la trasformazione di coordinate è invertibile ed in cui deve porsi \(r=r(x,y)\) e \(\theta = \theta (x,y)\), i secondi membri essendo le componenti di \(\Phi^{-1} (x,y)\).
Ti ringrazio per la generosa risposta. Mi prendo un po' di tempo per riflettere con carta e penna ma ammetto anche che ho un po' smarrito il punto dietro al formalismo che io stesso voglio utilizzare.
Credo che il motivo del mio momentaneo smarrimento sia il fatto che in fisica, come scriveva dissonance in quel post che linkavo prima, si "cambiano coordinate agli operatori". Inoltre non vedo nelle formule da te scritte nulla di famigliare e questo mi spaventa.
In soldoni, in fisica si dice, il gradiente in coordinate sferiche vale:
\[\nabla_{(\rho,\theta,\phi)}U = \left( \frac{\partial U}{\partial \rho}, \frac{1}{\rho} \frac{\partial U}{\partial \theta}, \frac{1}{\rho \sin\theta} \frac{\partial U}{\partial \phi}\right) \]
Al momento (sono un po' confuso
) non vedo il contatto tra questa formula e le formule di cui sopra. Forse ho sbagliato ad impostare il tutto.
Ci lavoro un po' sopra
Credo che il motivo del mio momentaneo smarrimento sia il fatto che in fisica, come scriveva dissonance in quel post che linkavo prima, si "cambiano coordinate agli operatori". Inoltre non vedo nelle formule da te scritte nulla di famigliare e questo mi spaventa.
In soldoni, in fisica si dice, il gradiente in coordinate sferiche vale:
\[\nabla_{(\rho,\theta,\phi)}U = \left( \frac{\partial U}{\partial \rho}, \frac{1}{\rho} \frac{\partial U}{\partial \theta}, \frac{1}{\rho \sin\theta} \frac{\partial U}{\partial \phi}\right) \]
Al momento (sono un po' confuso

Ci lavoro un po' sopra
Se vuoi formalizzare a modino questo tipo di ragionamenti l'ambito corretto è la geometria differenziale. E' lì infatti che gli operatori differenziali hanno una definizione "globale", ovvero indipendente dalla scelta di un sistema di coordinate. Nel caso particolare dello spazio euclideo la geometria differenziale si semplifica molto, e può essere utile impararne i fondamentali. Ti posso suggerire il libro Tensor algebra and tensor analysis for engineers di Itskov, che fa proprio questo lavoro. Mi fu consigliato qualche anno fa da ciampax su questo forum e a distanza di tempo posso dire che è stato un buon consiglio.
(Se guardi su una qualsiasi libreria online ne puoi trovare facilmente una copia in pdf.)
(Se guardi su una qualsiasi libreria online ne puoi trovare facilmente una copia in pdf.)
@gugo82
Aiutato anche da questa discussione ci sono finalmente arrivato. Il tassello che mi mancava era il fatto che sebbene abbiamo applicato il cambio di coordinate, la base del nostro spazio vettoriale è sempre \( \hat{i},\hat{j} \). Per ottenere la formula "finale" dobbiamo cambiare la base in \(\hat{r},\hat{\theta} \).
Ora torna tutto. Che stupido a non averci pensato prima. Ti ringrazio di cuore.
Appena avrò un po' tempo ricapitolo il ragionamento in modo da chiarirmi le idee e, soprattutto, in modo che possa servire ad altri che si porranno le stesse domande.
@dissonance
L'eleganza e la potenza della geometria differenziale hanno un incredibile fascino su di me. L'indipendenza dalle coordinate poi, passatemi il termine, che ficata!
Sempre più spesso nei miei excursus extra- o para- curricolari arrivo ai piedi di un monte altissimo e mi viene detto: "la risposta alle tue domande si trova sulla vetta, questo monte si chiama geometria differenziale". Scalare questo monte è nella mia todo list ma prima voglio prepararmi un bello zaino e le provviste per il lungo viaggio ma, soprattutto, devo trovarne il tempo.
Ti ringrazio per il consiglio bibliografico. Gli ho dato una rapida sfogliato e lo trovo molto accessibile e penso che potrà essere un ottimo invito alla geometria differenziale.
Grazie mille anche a te!
Aiutato anche da questa discussione ci sono finalmente arrivato. Il tassello che mi mancava era il fatto che sebbene abbiamo applicato il cambio di coordinate, la base del nostro spazio vettoriale è sempre \( \hat{i},\hat{j} \). Per ottenere la formula "finale" dobbiamo cambiare la base in \(\hat{r},\hat{\theta} \).
Ora torna tutto. Che stupido a non averci pensato prima. Ti ringrazio di cuore.
Appena avrò un po' tempo ricapitolo il ragionamento in modo da chiarirmi le idee e, soprattutto, in modo che possa servire ad altri che si porranno le stesse domande.
@dissonance
L'eleganza e la potenza della geometria differenziale hanno un incredibile fascino su di me. L'indipendenza dalle coordinate poi, passatemi il termine, che ficata!
Sempre più spesso nei miei excursus extra- o para- curricolari arrivo ai piedi di un monte altissimo e mi viene detto: "la risposta alle tue domande si trova sulla vetta, questo monte si chiama geometria differenziale". Scalare questo monte è nella mia todo list ma prima voglio prepararmi un bello zaino e le provviste per il lungo viaggio ma, soprattutto, devo trovarne il tempo.
Ti ringrazio per il consiglio bibliografico. Gli ho dato una rapida sfogliato e lo trovo molto accessibile e penso che potrà essere un ottimo invito alla geometria differenziale.
Grazie mille anche a te!
Finalmente ho trovato un po' di tempo libero per lavorarci un po' sopra e formalizzare un po' il tutto. Riporto qui le mie conclusioni.
Il problema che vogliamo affrontare, è come esprimere il gradiente in coordinate diverse da quelle cartesiane rettangolari. Come ha detto gugo82 questo problema si può tradurre così:
Poniamoci in $RR^2$ e consideriamo le coordinate polari $(r,\theta)$ per snellire i calcoli. I nostri ingredienti sono: la nostra funzione $U(x,y)$ alla quale per convenienza abbiamo applicato il cambio di coordinate $\Phi(r,\theta) = (r \cos\theta, r \sin \theta)$ definendo \(\tilde{U}(r,\theta) := U(\Phi(r,\theta))\).
Cominciamo:
Dato che \(\tilde{U} := U \circ \Phi\) sarà \(U = \tilde{U} \circ \Phi^{-1}\). Poniamo, per maggiore chiarezza nelle notazioni, $\Psi := \Phi^{-1}$. Possiamo quindi scrivere: \(U(x,y) = \tilde{U}(\Psi (x,y))\)
Calcoliamo quindi \(\nabla U\). Utilizzando la chain rule otteniamo:
\[\nabla U = \left[ (\nabla\tilde{U} \circ \Psi)^\text{T} \cdot \mathbf{D}\Psi \right] ^\text{T} = (\mathbf{D}\Psi)^{\text{T}} \cdot (\nabla\tilde{U} \circ \Psi)\]
Dove: \(\cdot\) rappresenta il prodotto "riga per colonna" e \(\mathbf{D}\Psi\) la matrice jacobiana di \(\Psi\). Se non convincono quei simboli di trasposto guardate qui.
Ricordando il teorema della funzione inversa possiamo scrivere:
\[\mathbf{D}\Psi = ((\mathbf{D}\Phi)^{-1}) \circ \Psi\]
e quindi:\[\nabla U = (((\mathbf{D}\Phi)^{-1})^\text{T} \circ \Psi) \cdot (\nabla\tilde{U} \circ \Psi) = (((\mathbf{D}\Phi)^{-1})^\text{T} \cdot \nabla\tilde{U}) \circ \Psi \]
Proviamo a esplicitare il tutto:
\[(\nabla U) \circ \Phi = \left( \begin{matrix} U_x \\ U_y \end{matrix} \right) = \left[ \left( \begin{matrix} \cos \theta & -r \sin \theta \\ \sin \theta & r\cos \theta\end{matrix} \right)^{-1} \right]^\text{T} \cdot \left( \begin{matrix} \tilde{U}_r \\ \tilde{U}_{\theta} \end{matrix} \right) \]
Quindi:
\[\left( \begin{matrix} U_x \\ U_y \end{matrix} \right) = \left( \begin{matrix} \cos \theta & - \frac{\sin \theta}{r} \\ \sin \theta & \frac{\cos \theta}{r}\end{matrix} \right)\cdot \left( \begin{matrix} \tilde{U}_r \\ \tilde{U}_{\theta} \end{matrix} \right) \]
Ottenendo:
\[\begin{cases} U_x = \tilde{U}_\theta \cos \theta - \tilde{U}_\theta \frac{\sin \theta}{r} \\U_y = \tilde{U}_\theta \sin \theta + \tilde{U}_\theta \frac{\cos \theta}{r} \end{cases}\]
Quel che ci manca è cambiare la base al nostro sistema di riferimento. La matrice che realizza questo cambio di base è la seguente:\[\text{S} = \left( \begin{matrix} \cos\theta & \sin\theta \\ \\ - \sin\theta & \cos\theta \end{matrix} \right)\]
In definitiva il vettore a cui siamo interessati si ottiene così:
\[(\nabla U) \circ \Phi = \text{S} \cdot ((\mathbf{D}\Phi)^{-1})^\text{T} \cdot \nabla \tilde{U} = \left( \begin{matrix} \cos\theta & \sin\theta \\ \\ - \sin\theta & \cos\theta \end{matrix} \right) \cdot \left( \begin{matrix} \cos \theta & - \frac{\sin \theta}{r} \\ \sin \theta & \frac{\cos \theta}{r}\end{matrix} \right) \cdot \left( \begin{matrix} \tilde{U}_r \\ \tilde{U}_{\theta} \end{matrix} \right)\]
Eseguendo il prodotto si ottiene finalmente:
\[(\nabla U) \circ \Phi = \left( \begin{matrix} \tilde{U}_{r} \\ \frac{\tilde{U}_{\theta}}{r} \end{matrix} \right)\]
Bene, sperando di non aver commesso errori, adesso che so come si ottiene il cambio di coordinate formalmente posso tornare ad usare i metodi scimmieschi
---
La cosa (per me) curiosa è che la diagonale del prodotto \(\text{S} \cdot ((\mathbf{D}\Phi)^{-1})^\text{T}\) rappresenta proprio il vettore "spostamento infinitesimo" $\vec{dl}$. E' un fatto curioso che teoricamente non riesco a spiegarmi. Idee?
Il significato geometrico di tutta la faccenda mi sfugge un pochino... Continuerò a pensarci.
Saluti
Il problema che vogliamo affrontare, è come esprimere il gradiente in coordinate diverse da quelle cartesiane rettangolari. Come ha detto gugo82 questo problema si può tradurre così:
"gugo82":Se ho un problema in cui figura \(\nabla u(x,y)\) ed in cui sembra conveniente rappresentare le variabili non già come coordinate rettangolari cartesiane, ma come coordinate di altro tipo, cosa devo sostituire alle componenti di \(\nabla u(x,y)\) per far tornare i conti?
Poniamoci in $RR^2$ e consideriamo le coordinate polari $(r,\theta)$ per snellire i calcoli. I nostri ingredienti sono: la nostra funzione $U(x,y)$ alla quale per convenienza abbiamo applicato il cambio di coordinate $\Phi(r,\theta) = (r \cos\theta, r \sin \theta)$ definendo \(\tilde{U}(r,\theta) := U(\Phi(r,\theta))\).
Cominciamo:
Dato che \(\tilde{U} := U \circ \Phi\) sarà \(U = \tilde{U} \circ \Phi^{-1}\). Poniamo, per maggiore chiarezza nelle notazioni, $\Psi := \Phi^{-1}$. Possiamo quindi scrivere: \(U(x,y) = \tilde{U}(\Psi (x,y))\)
Calcoliamo quindi \(\nabla U\). Utilizzando la chain rule otteniamo:
\[\nabla U = \left[ (\nabla\tilde{U} \circ \Psi)^\text{T} \cdot \mathbf{D}\Psi \right] ^\text{T} = (\mathbf{D}\Psi)^{\text{T}} \cdot (\nabla\tilde{U} \circ \Psi)\]
Dove: \(\cdot\) rappresenta il prodotto "riga per colonna" e \(\mathbf{D}\Psi\) la matrice jacobiana di \(\Psi\). Se non convincono quei simboli di trasposto guardate qui.
Ricordando il teorema della funzione inversa possiamo scrivere:
\[\mathbf{D}\Psi = ((\mathbf{D}\Phi)^{-1}) \circ \Psi\]
e quindi:\[\nabla U = (((\mathbf{D}\Phi)^{-1})^\text{T} \circ \Psi) \cdot (\nabla\tilde{U} \circ \Psi) = (((\mathbf{D}\Phi)^{-1})^\text{T} \cdot \nabla\tilde{U}) \circ \Psi \]
Proviamo a esplicitare il tutto:
\[(\nabla U) \circ \Phi = \left( \begin{matrix} U_x \\ U_y \end{matrix} \right) = \left[ \left( \begin{matrix} \cos \theta & -r \sin \theta \\ \sin \theta & r\cos \theta\end{matrix} \right)^{-1} \right]^\text{T} \cdot \left( \begin{matrix} \tilde{U}_r \\ \tilde{U}_{\theta} \end{matrix} \right) \]
Quindi:
\[\left( \begin{matrix} U_x \\ U_y \end{matrix} \right) = \left( \begin{matrix} \cos \theta & - \frac{\sin \theta}{r} \\ \sin \theta & \frac{\cos \theta}{r}\end{matrix} \right)\cdot \left( \begin{matrix} \tilde{U}_r \\ \tilde{U}_{\theta} \end{matrix} \right) \]
Ottenendo:
\[\begin{cases} U_x = \tilde{U}_\theta \cos \theta - \tilde{U}_\theta \frac{\sin \theta}{r} \\U_y = \tilde{U}_\theta \sin \theta + \tilde{U}_\theta \frac{\cos \theta}{r} \end{cases}\]
Quel che ci manca è cambiare la base al nostro sistema di riferimento. La matrice che realizza questo cambio di base è la seguente:\[\text{S} = \left( \begin{matrix} \cos\theta & \sin\theta \\ \\ - \sin\theta & \cos\theta \end{matrix} \right)\]
In definitiva il vettore a cui siamo interessati si ottiene così:
\[(\nabla U) \circ \Phi = \text{S} \cdot ((\mathbf{D}\Phi)^{-1})^\text{T} \cdot \nabla \tilde{U} = \left( \begin{matrix} \cos\theta & \sin\theta \\ \\ - \sin\theta & \cos\theta \end{matrix} \right) \cdot \left( \begin{matrix} \cos \theta & - \frac{\sin \theta}{r} \\ \sin \theta & \frac{\cos \theta}{r}\end{matrix} \right) \cdot \left( \begin{matrix} \tilde{U}_r \\ \tilde{U}_{\theta} \end{matrix} \right)\]
Eseguendo il prodotto si ottiene finalmente:
\[(\nabla U) \circ \Phi = \left( \begin{matrix} \tilde{U}_{r} \\ \frac{\tilde{U}_{\theta}}{r} \end{matrix} \right)\]
Bene, sperando di non aver commesso errori, adesso che so come si ottiene il cambio di coordinate formalmente posso tornare ad usare i metodi scimmieschi

---
La cosa (per me) curiosa è che la diagonale del prodotto \(\text{S} \cdot ((\mathbf{D}\Phi)^{-1})^\text{T}\) rappresenta proprio il vettore "spostamento infinitesimo" $\vec{dl}$. E' un fatto curioso che teoricamente non riesco a spiegarmi. Idee?
Il significato geometrico di tutta la faccenda mi sfugge un pochino... Continuerò a pensarci.
Saluti

Non ho capito cosa vuoi dire con la storia della diagonale del prodotto. E' un po' complicato seguire le tue notazioni, anche se si capisce che hai capito il concetto. Immagino comunque che tutto si chiarisca guardando la cosa in coordinate cartesiane, dove
\[
d\vec{l} = dx e_1 +dy e_2+ dz e_3.\]
Se questo oggetto ha la struttura di "una diagonale" (non capisco cosa significhi ma provo ad andare avanti lo stesso) allora potrebbe essere che continuerà a conservare tale struttura dopo i vari cambi di coordinate. Difatti, localmente, i cambi di coordinate curvilinee si riducono a cambiamenti di coordinate lineari, e quindi a similitudine (ortogonale) di matrici. Molti oggetti dell'algebra lineare, come la traccia, sono conservati da tali operazioni.
\[
d\vec{l} = dx e_1 +dy e_2+ dz e_3.\]
Se questo oggetto ha la struttura di "una diagonale" (non capisco cosa significhi ma provo ad andare avanti lo stesso) allora potrebbe essere che continuerà a conservare tale struttura dopo i vari cambi di coordinate. Difatti, localmente, i cambi di coordinate curvilinee si riducono a cambiamenti di coordinate lineari, e quindi a similitudine (ortogonale) di matrici. Molti oggetti dell'algebra lineare, come la traccia, sono conservati da tali operazioni.
"dissonance":
Non ho capito cosa vuoi dire con la storia della diagonale del prodotto.
Hai ragione, provo a spiegarmi meglio. Abbiamo visto che il gradiente "in coordinate polari" si ottiene applicando l'operatore lineare (la matrice insomma) \(\text{T} := \text{S} \cdot ((\mathbf{D}\Phi)^{-1})^\text{T} \).
Dove appunto \(\text{S}\) è il cambio di base da \(\left\{\mathbf{e}_1,\mathbf{e}_2\right\}\) a \(\left\{ \mathbf{e}_r,\mathbf{e}_\theta \right\} \) ( nello specifico una rotazione) e \(\mathbf{D \Phi}\) è la matrice jacobiana della trasformazione $\mathbf{\Phi}$.
Se vogliamo esplicitare tale matrice $\text{T}$ otteniamo, nel caso specifico:
\[\text{T} = \left( \begin{matrix} 1 & 0 \\ 0 & \frac{1}{r} \end{matrix} \right)\]
Che applicare al vettore $(U_r,U_\theta)$ ci da la corretta espressione del gradiente.
Quello che mi sembrava "curioso", ma ora già mi sembra meno, è il fatto che la diagonale di $\text{T}^{-1}$ sia proprio composta da quelli che qui chiamano "scale factors".
Ma chiaramente, ragionare a questo livello quasi empirico non ha senso. Queste cose sono da vedere nel giusto contesto della geometria differenziale.
Non è che non ha senso, è solo più difficile. Con il giusto linguaggio diventa tutto ovvio. In un sistema di coordinate curvilinee il gradiente ha questa espressione:
\[
\nabla f (p)= \sum_{ij} g^{ij} \frac{\partial f}{\partial y^i}(p) \mathbf{t}_j,
\]
dove i \(\mathbf{t}_j\) sono i vettori tangenti le linee coordinate nel punto \(p\). Quando il sistema di coordinate è ortogonale, come nel tuo caso, la matrice \(g^{ij}\) è diagonale e contiene esattamente i reciproci quadrati dei fattori di scala: in gergo si chiama tensore metrico (più precisamente è la sua inversa).
I vettori tangenti sono dati dalla formula
\[
\mathbf{t}_j= \frac{\partial \mathbf{r}}{\partial y^j},
\]
dove \(\mathbf{r}\) è il raggio vettore. Chiaramente questi vettori non sono necessariamente normalizzati, per cui spesso si riscrivono come
\[
\mathbf{t}_j=l_j \mathbf{e}_j,
\]
dove gli \(\mathbf{e}_j\) sono dei versori e \(l_j\) sono i fattori di scala. Inserendo tutte queste informazioni nella formula generale del gradiente, otteniamo l'espressione del gradiente in un sistema ortogonale:
\[
\nabla f(p)=\sum_{i} \frac{1}{l_i} \frac{\partial f}{\partial y^i}(p) \mathbf{e}_i,
\]
ed ecco perché ti ritrovi i fattori di scala, come osservavi.
Un modo veloce per ricostruire l'ultima formula è ragionare dimensionalmente, come farebbe un fisico: il gradiente di una funzione adimensionale deve necessariamente avere le dimensioni dell'inverso di una lunghezza, ma in un sistema di coordinate curvilinee non necessariamente le coordinate sono dimensionate. (La coordinata \(\theta\) di un sistema di coordinate polari piane ne è un esempio). Ecco perché devi metterci dei denominatori con le dimensioni di una lunghezza, e questi denominatori sono proprio i fattori di scala.
\[
\nabla f (p)= \sum_{ij} g^{ij} \frac{\partial f}{\partial y^i}(p) \mathbf{t}_j,
\]
dove i \(\mathbf{t}_j\) sono i vettori tangenti le linee coordinate nel punto \(p\). Quando il sistema di coordinate è ortogonale, come nel tuo caso, la matrice \(g^{ij}\) è diagonale e contiene esattamente i reciproci quadrati dei fattori di scala: in gergo si chiama tensore metrico (più precisamente è la sua inversa).
I vettori tangenti sono dati dalla formula
\[
\mathbf{t}_j= \frac{\partial \mathbf{r}}{\partial y^j},
\]
dove \(\mathbf{r}\) è il raggio vettore. Chiaramente questi vettori non sono necessariamente normalizzati, per cui spesso si riscrivono come
\[
\mathbf{t}_j=l_j \mathbf{e}_j,
\]
dove gli \(\mathbf{e}_j\) sono dei versori e \(l_j\) sono i fattori di scala. Inserendo tutte queste informazioni nella formula generale del gradiente, otteniamo l'espressione del gradiente in un sistema ortogonale:
\[
\nabla f(p)=\sum_{i} \frac{1}{l_i} \frac{\partial f}{\partial y^i}(p) \mathbf{e}_i,
\]
ed ecco perché ti ritrovi i fattori di scala, come osservavi.
Un modo veloce per ricostruire l'ultima formula è ragionare dimensionalmente, come farebbe un fisico: il gradiente di una funzione adimensionale deve necessariamente avere le dimensioni dell'inverso di una lunghezza, ma in un sistema di coordinate curvilinee non necessariamente le coordinate sono dimensionate. (La coordinata \(\theta\) di un sistema di coordinate polari piane ne è un esempio). Ecco perché devi metterci dei denominatori con le dimensioni di una lunghezza, e questi denominatori sono proprio i fattori di scala.
Caro dissonance, mi hai illuminato!
Scrivendo queste formule mi hai fatto un bellissimo regalo. Finalmente vedo un po' di geometria differenziale rigorosa ma non ermetica.
Con l'inizio del semestre sarò distratto da queste tematiche ma mi riprometto di approfondire quanto prima (mi sono annotato il tuo consiglio bibliografico). Per ora mi accontento di lasciarmi incantare da una così belle ed elegante formula come quella del gradiente da te scritta. Posso chiederti da che testo l'hai studiata? L'Itskov di cui avevi accennato?
Ti ringrazio ancora. Alla prossima
Scrivendo queste formule mi hai fatto un bellissimo regalo. Finalmente vedo un po' di geometria differenziale rigorosa ma non ermetica.
Con l'inizio del semestre sarò distratto da queste tematiche ma mi riprometto di approfondire quanto prima (mi sono annotato il tuo consiglio bibliografico). Per ora mi accontento di lasciarmi incantare da una così belle ed elegante formula come quella del gradiente da te scritta. Posso chiederti da che testo l'hai studiata? L'Itskov di cui avevi accennato?
Ti ringrazio ancora. Alla prossima

Sono cose che si imparano un po' da varie parti. Geometria differenziale, meccanica dei fluidi, PDE ... Ogni volta che studi un argomento che fa uso del calcolo differenziale aggiungi un tassello al puzzle. L'Itskov è una delle fonti, ma per me è stato utile confrontare il suo punto di vista strettamente euclideo con il punto di vista astratto della geometria Riemanniana. Ci vuole un po' di tempo per digerire il tutto, e per rendersi conto che era molto più facile di come sembrasse. Una lettura molto simpatica e utile è stata per me questa dispensa di R. Sharipov sul calcolo tensoriale. Questo forse puoi leggiucchiarlo così, per diletto, visto che non è un libro ma solo qualche pagina sparsa. Non ti ci fissare troppo, però.