Formula di cambiamento delle basi.
Sia dato uno spazio $V^3(K)$ e due sue basi $B = (e_1, e_2, e_3)$ e $B' = (e'_1, e'_2, e'_3)$.
Si vvuole trovare la formula del cambiamento delle basi, che permetta di passare, cioè, dalle componenti di un generico vettore dello spazio di $B$ alle componenti di $B'$.
Controllate, per piacere, se i miei calcoli sono giusti (da notare che i termini in "e" sono vettori, mentre i termini in "a" sono scalari, anche se la notazione è identica).
Sia:
$e'_1 = a_(11)e_1 + a_(12)e_2 + a_(13)e_3$
$e'_2 = a_(21)e_1 + a_(22)e_2 + a_(23)e_3$ $(1)$
$e'_3 = a_(31)e_1 + a_(32)e_2 + a_(33)e_3$
Si può scrivere, in forma compatta,
$((e'_1),(e'_2),(e'_3)) = ((a_(11),a_(12),a_(13)),(a_(21),a_(22),a_(23)),(a_(31),a_(32),a_(33))) * ((e_1),(e_2),(e_3))$
??
Oppure dovrei scrivere la matrice $3 x 3$ così:
$((a_(11),a_(21),a_(31)),(a_(12),a_(22),a_(32)),(a_(13),a_(23),a_(33)))$,
come tutte le fonti suggeriscono?
(Da notare che nell'utilizzo del doppio indice, non si fa riferimento alla convenzione secondo cui il primo indice è quello della riga e il secondo quello della colonna).
Perchè, verificando con i conti mi viene vera la prima uguaglianza, anche se poi, osservando gli appunti, vedo che compare la seconda.
In definitiva la mia domanda è:
Come è possibile scrivere la $(1)$ in forma compatta usando il prodotto righe per colonne tra matrici, e in base a quali passaggi?
Si vvuole trovare la formula del cambiamento delle basi, che permetta di passare, cioè, dalle componenti di un generico vettore dello spazio di $B$ alle componenti di $B'$.
Controllate, per piacere, se i miei calcoli sono giusti (da notare che i termini in "e" sono vettori, mentre i termini in "a" sono scalari, anche se la notazione è identica).
Sia:
$e'_1 = a_(11)e_1 + a_(12)e_2 + a_(13)e_3$
$e'_2 = a_(21)e_1 + a_(22)e_2 + a_(23)e_3$ $(1)$
$e'_3 = a_(31)e_1 + a_(32)e_2 + a_(33)e_3$
Si può scrivere, in forma compatta,
$((e'_1),(e'_2),(e'_3)) = ((a_(11),a_(12),a_(13)),(a_(21),a_(22),a_(23)),(a_(31),a_(32),a_(33))) * ((e_1),(e_2),(e_3))$
??
Oppure dovrei scrivere la matrice $3 x 3$ così:
$((a_(11),a_(21),a_(31)),(a_(12),a_(22),a_(32)),(a_(13),a_(23),a_(33)))$,
come tutte le fonti suggeriscono?
(Da notare che nell'utilizzo del doppio indice, non si fa riferimento alla convenzione secondo cui il primo indice è quello della riga e il secondo quello della colonna).
Perchè, verificando con i conti mi viene vera la prima uguaglianza, anche se poi, osservando gli appunti, vedo che compare la seconda.
In definitiva la mia domanda è:
Come è possibile scrivere la $(1)$ in forma compatta usando il prodotto righe per colonne tra matrici, e in base a quali passaggi?
Risposte
Ragazzi, salve, chiedo di nuovo scusa.
C'è qualcosa di poco chiaro nella mia domanda? Cioè, è posta in modo poco comprensibile?
Il mio problema è davvero grande, non so davvero come risolverlo.
C'è qualcosa di poco chiaro nella mia domanda? Cioè, è posta in modo poco comprensibile?
Il mio problema è davvero grande, non so davvero come risolverlo.
Vedi un po' sul mitico pdf di M.Cailotto:
http://www.math.unipd.it/~maurizio/m2m/AGLQ78pp.pdf
Mi ricordo che lì si usava una notazione compatta per la formula del cambiamento di base, forse può fare al caso tuo.
http://www.math.unipd.it/~maurizio/m2m/AGLQ78pp.pdf
Mi ricordo che lì si usava una notazione compatta per la formula del cambiamento di base, forse può fare al caso tuo.
Sì, una formula l'ho trovata (pag. 73 delle dispense), ed in effetti rispetto alla formula che ho postato io c'è una differenza: in quella delle dispense, infatti il prodotto vede come primo fattore la matrice dei vettori della base $(w_1, ..., w_n)$ e come seconda matrice quella dei coefficienti in $a$. Inoltre, sempre a differenza della formula che ho postato io, in questo caso, per quanto riguarda la matrice dei vettori $(w_1, ..., w_n)$, questi vettori vengono considerati come colonne (in pratica ad ogni colonna corrisponde il vettore rappresentato da ogni $w_i$), mentre nella formula postata da me venivano considerati come righe di una matrice.
Si dovrebbe dimostrare l'eventuale equivalenza tra le due formule (quella da me riportata, e quella delle dispense).
Tuttavia, la mia difficoltà sta nel passare dalle equivalenze $(1)$ alla forma compatta. Ho provato a partire dalle $(1)$ per arrivare al mio risultato, ma non ci sono riuscito, o meglio, ci sarei pure riuscito, ma non so se la mia dimostrazione è corretta. Inoltre, essa è troppo lunga, di conseguenza, diffidando dai procedimenti troppo lunghi (:-D), non so se devo farlo (mi dirai, o forse, mi direte, così sarebbe anche un valido esercizio di memoria per me).
Da notare, infine, che alla fine si può arrivare, tramite i coordinati su R^n, a semplificare notevolmente le notazioni. Tuttavia, prima di addentrarmi nella semplificazione, volevo chiarire prima questo punto.
Si dovrebbe dimostrare l'eventuale equivalenza tra le due formule (quella da me riportata, e quella delle dispense).
Tuttavia, la mia difficoltà sta nel passare dalle equivalenze $(1)$ alla forma compatta. Ho provato a partire dalle $(1)$ per arrivare al mio risultato, ma non ci sono riuscito, o meglio, ci sarei pure riuscito, ma non so se la mia dimostrazione è corretta. Inoltre, essa è troppo lunga, di conseguenza, diffidando dai procedimenti troppo lunghi (:-D), non so se devo farlo (mi dirai, o forse, mi direte, così sarebbe anche un valido esercizio di memoria per me).
Da notare, infine, che alla fine si può arrivare, tramite i coordinati su R^n, a semplificare notevolmente le notazioni. Tuttavia, prima di addentrarmi nella semplificazione, volevo chiarire prima questo punto.
PREMESSA importante: mettiamoci d'accordo sulle convenzioni. Per rappresentare le applicazioni lineari mediante matrici interpretiamo le coordinate dei vettori come vettori colonna. Di solito si fa così, perché così le applicazioni lineari sono rappresentate per moltiplicazione a sinistra ($x\mapstoMx$ - spero sia chiaro a cosa mi riferisco, altrimenti fallo presente).
Con questa rappresentazione dei vettori, se $V$ è uno spazio vettoriale e $B=(e_1, ..., e_n), B'=(e'_1,...,e'_n)$ sono due basi, la matrice di cambiamento di coordinate dalla base $B'$ alla base $B$ è quella che ha sulle colonne le coordinate dei vettori di $B'$ rispetto alla base $B$.
_________________________________________
Detto questo, mi pare che funzioni tutto se metti i vettori in riga e gli scalari in colonna, che poi è ciò che fa il pdf. Quindi intanto diamo una definizione di prodotto riga per colonna:
se $V$ è uno spazio vettoriale, $v_1, ..., v_n$ sono suoi vettori e $lambda_1, ..., lambda_n$ sono scalari, allora con $(v_1, ..., v_n)((lambda_1), (vdots), (lambda_n))$ intendiamo il vettore $lambda_1v_1+...+lambda_nv_n$. Così possiamo definire il prodotto di una matrice di vettori e una di scalari, di dimensioni compatibili: sottolineo che teniamo i vettori a sinistra e gli scalari a destra.
Ora siano $B=(e_1...e_n)$ e $B'=(e'_1...e'_n)$ due basi di $V$. In particolare per ogni $j=1..n$ esiste un'unica $n$-upla di scalari $((m_{1, j}),(m_{2, j}), (vdots), (m_{n, j}))$ tale che $e'_j=(e_1, ..., e_n) ((m_{1, j}),(m_{2, j}), (vdots), (m_{n, j}))$. Definiamo $M=(m_{i, j})_{1<=i, j<=n}$: risulta che $(e'_1, ..., e'_n)=(e_1, ..., e_n)M$ per costruzione.
Questa $M$ è proprio la matrice di cambiamento di coordinate dalla base $B'$ alla base $B$. Con il metodo seguito da te hai ottenuto la matrice trasposta di $M$.
Con questa rappresentazione dei vettori, se $V$ è uno spazio vettoriale e $B=(e_1, ..., e_n), B'=(e'_1,...,e'_n)$ sono due basi, la matrice di cambiamento di coordinate dalla base $B'$ alla base $B$ è quella che ha sulle colonne le coordinate dei vettori di $B'$ rispetto alla base $B$.
_________________________________________
Detto questo, mi pare che funzioni tutto se metti i vettori in riga e gli scalari in colonna, che poi è ciò che fa il pdf. Quindi intanto diamo una definizione di prodotto riga per colonna:
se $V$ è uno spazio vettoriale, $v_1, ..., v_n$ sono suoi vettori e $lambda_1, ..., lambda_n$ sono scalari, allora con $(v_1, ..., v_n)((lambda_1), (vdots), (lambda_n))$ intendiamo il vettore $lambda_1v_1+...+lambda_nv_n$. Così possiamo definire il prodotto di una matrice di vettori e una di scalari, di dimensioni compatibili: sottolineo che teniamo i vettori a sinistra e gli scalari a destra.
Ora siano $B=(e_1...e_n)$ e $B'=(e'_1...e'_n)$ due basi di $V$. In particolare per ogni $j=1..n$ esiste un'unica $n$-upla di scalari $((m_{1, j}),(m_{2, j}), (vdots), (m_{n, j}))$ tale che $e'_j=(e_1, ..., e_n) ((m_{1, j}),(m_{2, j}), (vdots), (m_{n, j}))$. Definiamo $M=(m_{i, j})_{1<=i, j<=n}$: risulta che $(e'_1, ..., e'_n)=(e_1, ..., e_n)M$ per costruzione.
Questa $M$ è proprio la matrice di cambiamento di coordinate dalla base $B'$ alla base $B$. Con il metodo seguito da te hai ottenuto la matrice trasposta di $M$.
PREMESSA importante: mettiamoci d'accordo sulle convenzioni. Per rappresentare le applicazioni lineari mediante matrici interpretiamo le coordinate dei vettori come vettori colonna.
Quale sarebbe l'applicazione lineare in questione, io devo ancora verificarlo. E' una mia mancanza, nel senso che si parla ovunque di combinazioni lineari, ma io non ho mai approfondito la questione. Inoltre, in prima istanza, io provo a ragionare con i vettori e non con i loro coordinati. Di conseguenza, stando alla definizione di "applicazione lineare", una collezione di vettori non sembra essere un elemento di uno spazio, almeno se non li consideriamo come componenti una matrice. In tal caso, gli spazi dominio e immagine sono spazi di matrici, e quindi rientriamo nella definizione di applicazione lineare.
Considerando i coordinati in $R^n$ di un vettore secondo due basi $B$ e $B'$, allora ecco che la definizione di applicazione linare risulta immediatamente visibile. Si hanno infatti funzioni che vanno da $R^n$ a $R^n$, con $R^n$ che è uno spazio vettoriale.
Non so se è chiaro questo punto.
In ogni caso, mi premeva soffermarmi sulla semplice "compattazione" delle equivalenze $(1)$ tramite le matrici, e successivamente indagare il discorso dei coordinati. Non sarebbe difficile farlo subito, ma la mia mente è in crisi, e quindi sono costretto a procedere così.
Quindi intanto diamo una definizione di prodotto riga per colonna:
Ecco, questa definizione mi mancava. Io conoscevo solo quella relativa a matrici di scalari. Di conseguenza, trasformavo la riga di vettori in una matrice $m x n$, dove con $m$ indico il numero di scalari che compongono i vettori di una base. E ragionavo con il prodotto tra matrici. Arrivavo a "intuire" il ragionamento senza riuscire a certificarlo.
Con il metodo seguito da te hai ottenuto la matrice trasposta di M.
E se invece volessi scrivere $(e'_1, ... , e'_n) = M (e_1, ..., e_n)$?
Dovrei mettere al posto di $M$ la trasposta della $M$ che hai trovato tu, oppure è proprio sbagliato scrivere così?
Non si passa dalle componenti di un generico vettore dello spazio di B alle componenti di B', ma dalle coordinate rispetto a B di un vettore alle coordinate dello stesso vettore rispetto a B'.
Dire componenti e dire coordinate, non è la stessa cosa? Seguendo, ovviamente, la traduzione geometrica che hanno alcuni spazi vettoriali algebrici.
si parte dal caso più generale, quello della matrice associata ad un'applicazione lineare,
Non ho mai sentito parlare di matrici associate ad un' applicazione lineare, quindi adesso come adesso mi sento un po' spaesato (non fa parte del corso che ho seguito io questo argomento).
In ogni caso, Sergio, ma anche dissonance, mi confermate che l'unico modo per arrivare alle mie $(1)$ a partire dalla forma compatta sia, ora come ora, considerare il prodotto righe per colonne tra righe di vettori e colonne di scalari, definito da dissonance. Dopodichè, arrivare, da questa forma compatta, a derivare, con un metodo empirico (che possiedo io), l'equivalenza $y=Mx$, dove $y$ e $x$ sono ennuple di scalari, arrivando quindi a ragionare con i coordinati.
In attesa di altre risposte, dico che comunque questa discussione la conserverò come oro colato: se dovessi avere la possibilità di approfondire i miei studi sulle applicazioni lineari, la riprenderò con tanto piacere.
Grazie a tutti, per adesso!
@turtle: Una nota: questo fatto di moltiplicare righe di vettori e colonne di scalari non è una cosa universale, e neanche niente di particolarmente importante. Sopra parlavo di prodotto $(e_1...e_n)((lambda_1), (vdots), (lambda_n))$ con vettori a sinistra e scalari a destra: niente di più che una scrittura compatta per la combinazione lineare $lambda_1e_1+...lambda_n e_n$.
Incidentalmente, poi, questa scrittura fornisce una espressione simpatica per la matrice di cambiamento di coordinate, ma non è che con questa ci dobbiamo sposare, né leggervi nulla di trascendentale. Infatti non tutti gli autori fanno così, anzi per la verità è una maniera di fare che ho trovato solo sul pdf di prima. Se ti fa confondere lascia perdere immediatamente.
Incidentalmente, poi, questa scrittura fornisce una espressione simpatica per la matrice di cambiamento di coordinate, ma non è che con questa ci dobbiamo sposare, né leggervi nulla di trascendentale. Infatti non tutti gli autori fanno così, anzi per la verità è una maniera di fare che ho trovato solo sul pdf di prima. Se ti fa confondere lascia perdere immediatamente.
Beh, a me interessava soltanto "compattare", appunto. La cosa importante era mettere la matrice alla destra della colonna dei vettori della base $B$, laddove, invertendo le cose, mi usciva fuori la matrice trasposta.
Poi, domani, a mente fresca, esporro un altro problema pratico che mi sembra correlato a questo.
La mia difficoltà sta nel dover capire anche senza conoscere nulla a proposito delle matrici associate. Quindi me la devo cavare con trucchi empirici, come quello di invertire i fattori nel prodotto tra matrici. A me basta solo qualcosa che mi faccia andare avanti (per ora), e che non strida con quanto vedo su altri libri (es. libro di fisica: io vedo una cosa strana di cui parlerò domani).
Poi, domani, a mente fresca, esporro un altro problema pratico che mi sembra correlato a questo.
La mia difficoltà sta nel dover capire anche senza conoscere nulla a proposito delle matrici associate. Quindi me la devo cavare con trucchi empirici, come quello di invertire i fattori nel prodotto tra matrici. A me basta solo qualcosa che mi faccia andare avanti (per ora), e che non strida con quanto vedo su altri libri (es. libro di fisica: io vedo una cosa strana di cui parlerò domani).
"turtle87":
(es. libro di fisica: io vedo una cosa strana di cui parlerò domani).
Ho una mezza idea di cosa possa essere...Forse riguarda il prodotto vettore?
Nell'attesa faccio i complimenti a Sergio per la pazienza biblica. Questo dualismo componenti/coordinate dei vettori di $\mathbb{K}^n$ è uno dei fatti più rognosi da mandare giù per uno studente, soprattutto perché è proprio scocciante scrivere tutte queste letteruzze con apici e pedici. Meno male che c'è Sergio ad accollarsi questa rottura

Quanto poi uno dice che non ha le idee chiare sulle combinazioni lineari... mi cascano le braccia.
In effetti, qui c'è stato un errore di confusione da parte mia. Ho scritto "combinazioni lineari" al posto di "applicazioni lineari". Mi sono confuso, senza accorgermene. Ti chiedo scusa.
Turtle, ma che esame stai preparando? Su che testo stai studiando?
L'esame è un esame per ingegneria, ridotto ai minimi termini per varie questioni di sistema che non credo sia il caso di discutere.
Delle applicazioni lineari ho fatto solo alcune cose, in particolare non ho trattato le matrici associate ad un'applicazione lineare.
Quella che io chiamo "formula di cambiamento delle basi", interpretandola appunto come formula particolare, che non si rifà a una prassi generale (quella appunto delle matrici associate alle applicazioni lineari, che valgono per tutte le applicazioni, e non solo per quella identica, che interessa a me, ripeto, in modo specifico).
Studio su dispense, ed è sufficiente, anche se per me, che ho difficoltà spesso a capire i concetti sintetizzati, sarebbe opportuno consultare un testo. Il problema dei testi, però, è che ampliano le conoscenze a tal punto da risultare un po' fuorvianti, se non altro perchè forniscono moltissime informazioni aggiuntive, che, in assenza di spiegazioni ai corsi (ripeto, il corso è troppo "piccolo"), finirebbero con l'appesantire il discorso.
In ogni caso, il mio problema era un problema formale. Nel senso che invece di voler dimostrare l'uguaglianza
$(e_1', ..., e_n') = (e_1, ..., e_n)M$
io volevo dimostrare l'uguaglianza
$((e_1'), (...), (e_n')) = M ((e_1), (...), (e_n))$,
cosa, evidentemente impossibile.
Da notare che nello scrivere questi prodotti, ho usato la "convenzione" enunciata da dissonance, quella di considerare il prodotto tra collezioni di vettori e matrici, convenzione che ha un puro significato formale.
In assenza di conoscenze "organiche" sulle applicazioni lineari e le matrici ad esse associate, io arrivavo, con un metodo empirico che mi è chiaro (il passaggio difficile era quello "impossibile" che tentavo di fare, prima, a proposito dei vettori, per giustificare che i pesi diventassero colonne e non righe

dove $\bar y$ e $\bar x$ sono i coordinati di uno stesso vettore nello spazio isomorfo $R^3$, secondo due basi (la colonna $x$ praticamente è costituita dai pesi secondo una base, la colonna $y$ secondo un'altra base).
Poi, ciò non toglie che, appena avrò un po' più di tempo e (soprattutto) entusiasmo, mi rileggerò l'introduzione di Sergio, e approfondirò la mia conoscenze delle applicazioni lineari e delle matrici ad esse connesse.
In ogni caso, quello che mi premeva dimostrare era un'altra cosa, un'altra sottigliezza, che denota l'apparente ambiguità di linguaggio (presente nella mia mente) a proposito dei termini "componenti" e "coordinate".
Dunque, siano date due basi ortonormali, $B = (e_1, ..., e_n)$ e $B' = (e_1', ..., e_n')$, e sia dato un vettore $v$ appartenente allo spazio $V$ di cui $B$ e $B'$ sono basi.
Se per coordinate si intendono i pesi della combinazione lineare $v = (a_1)*(e_1) + ... + (a_n)*(e_3)$, per componenti del vettore secondo la base B si dovrebbero intendere gli stessi pesi: $v = (a_1, ..., a_n)$.
Se ciò è vero, allora io vengo al problema fisico che sembra ancora una volta trasporre la matrice $M$.
Sia dato un vettore $v$ dello spazio $V$ dei vettori geometrici applicati in un punto. Siano $B$ e $B'$ due basi ortonormali, evidentemente composte da tre vettori ciascuna: $B = (e_1, ..., e_n)$, $B' = (e_1' + ..., e_n')$.
Vogliamo capire qual è la "matrice delle rotazioni", la matrice, cioè, che permetta di passare dalle componenti cartesiane rispetto alla base $B$ alle componenti cartesiane rispetto alla base $B'$.
Sia dunque un vettore $v$ e siano $v_x, v_y, e v_z$ le coordinate rispetto alla base $B$. Se vale l'isomorfismo tra $V$ (spazio dei vettori geometrici) e $R^3$ (spazio delle terne), allora si può indifferentemente parlare di componenti del vettore geometrico rispetto alla base $B$ e di coordinate dello stesso vettore rispetto alla base $B$ (in un caso per base indico i vettori geometrici $e_1, ..., e_n$, nell'altro le terne $(e_1, ..., e_n)$ isomorfe alle omonime terne geometriche). Probabilmente c'è la sfumatura di significato legata al fatto che per "componenti" si intende la traduzione geometrica di un vettore, mentre per "coordinate" l'interpretazione algebrica, resa possibile dall'esistenza stessa dell' isomorfismo.
Comunque quello dell'ambiguità di linguaggio tra i due termini è solo il primo problema.
Il secondo problema è quello legato alla matrice, all'inversione righe-colonne che si verifica anche qui.
Si può scrivere:
$v_x' = \vec v * \hat i' = (v_x)*(a_(11)) + (a_(21))*(v_y) + (a_(31))*(v_z) $
$v_y' = \vec v * \hat j' = (v_x)*(a_(12)) + (a_(22))*(v_y) + (a_(32))*(v_z) $
$v_z' = \vec v * \hat k' = (v_x)*(a_(13)) + (a_(23))*(v_y) + (a_(33))*(v_z) $
e, scrivendo in forma compatta:
$((v_x'),(v_y'),(v_z')) = ((a_(11), a_(21), a_(31)),(a_(12), a_(22), a_(32)),(a_(13), a_(23), a_(33)))*((v_x),(v_y),(v_z))$,
dove (dimenticavo...) gli indici in $a$ rappresentano le coordinate secondo la terna $(e_1, e_2, e_3)$ dei vettori $(e_1', e_2', e_3')$.
Come (spero) si possa vedere, esce nuovamente la matrice trasposta di $M$.
I casi sono due:
1) O mi sfugge qualcosa, cosicchè io applico l'uguaglianza $y = Mx$ non a buon diritto;
2) Oppure c'è qualche cosa che non considero, qualche incomprensione o errore.
P.S.- Spero che le matrici si vedano: ho fatto una prova, non si vedevano prima; è come se fosse andato in tilt il meccanismo di traduzione.
"turtle87":
$((v_x'),(v_y'),(v_z')) = ((a_(11), a_(21), a_(31)),(a_(12), a_(22), a_(32)),(a_(13), (a_(23), (a_(33)))*((v_x),(v_y),(v_z))$,
P.S.- Spero che le matrici si vedano: ho fatto una prova, non si vedevano prima; è come se fosse andato in tilt il meccanismo di traduzione.
$((v_x'),(v_y'),(v_z')) = ( ( a_(11), a_(21), a_(31) ) , ( a_(12), a_(22), a_(32) ) , ( a_(13), a_(23), a_(33) ) )*((v_x),(v_y),(v_z))$,
Basta mettere le parentesi al posto giusto, così come sarebbe meglio mettere il segno di "dollaro" alla fine di una formula, cosa che ho già corretto nel post precedente.
Sarebbe anche il caso di NON mandare un PM ad un amministratore per queste cose.
Basta mettere le parentesi al posto giusto, così come sarebbe meglio mettere il segno di "dollaro" alla fine di una formula, cosa che ho già corretto nel post precedente.
Era che non vedevo, pur avendo messo il segno di dollaro dove credevo andasse messo (probabilmente c'era un errore, comunque), i risultati della "conversione".
Sarebbe anche il caso di NON mandare un PM ad un amministratore per queste cose.
Ok, chiedo venia.