Nucleo e immagine di un'applicazione (recall)

mobley
Un esercizio di programmazione chiede, data la matrice $ A=( ( 1 , 1 , -1 , 2 ),( 1 , 1 , 0 , 3 ),( -1 , 0 , 1 , 0 ) ) $, di determinare $ker$ ed $Im$ con relative dimensioni e basi.

Da reminescenze di algebra lineare ottengo $dim(Im[A])=3$ con base ${ [ ( 1),( 1 ),( -1) ]; [ ( 1 ),( 1 ),( 0 ) ] ;[ ( -1),( 0 ),( 1 ) ] }$
e $dim(ker[A])=1$ con base $ {[ ( -1 ),( -2 ),( -1 ),( 1 ) ] } $.

Ok. I risultati sono corretti ma non ricordo precisamente la differenza tra nucleo ed immagine in quanto tali rispetto alle loro basi. Mi sento di poter dire $ker[A]$ e $Im[A]$ sono le rette di $RR^4$ ed $RR^3$ formate dalle loro basi ma come formalizzo la cosa? Vale a dire, come si dovrebbe rispondere ad una domanda del tipo "Calcola il $ker[A]$?".

Un'ultima cosa. Mi sembra di ricordare che in un tema d'esame venisse chiesto di calcolare anche il $ker$ trasposto... Possibile? Se sì, come lo calcolereste rispetto ai dati di questo esercizio?

Grazie mille a chiunque vorrà aiutarmi! :D

Risposte
Bokonon
Se permetti provo a dartene una visione geometrica.

Il Kernel è lo spazio vettoriale perpendicolare allo spazio generato dalle righe: è la soluzione del sistema omogeneo.
Infatti se fai il prodotto scalare di ogni riga per il kernel che hai trovato si ottiene il vettore nullo (0,0,0).
Prendiamo il caso specifico. Visto che lo spazio di partenza è $R^4$ puoi scegliere una base diversa da quella canonica composta dalle righe di A e il kernel. Le righe di A creano un sottospazio vettoriale di dimensione 3 e il kernel di dimensione 1 (una retta) e questi due sottospazi sono perpendicolari fra di loro, quindi possono essere messi in somma diretta 3+1=4.

L'applicazione in se invece manda i vettori di $R^4$ in $R^3$. Puoi visualizzarla meglio usando la base di $R^4$ cui sopra.
In pratica tutti i vettori appartenenti allo spazio generato delle righe P (un iperpiano di dimensione 3) vengono uno ad uno inviati in $R^3$.
In altre parole, se si considerano solo i vettori appartenenti a P, l'applicazione è iniettiva e riduce la dimensione dei vettori perchè possono effettivamente essere mappati in uno spazio isomorfo di dimensione 3. Per esempio $Ap=p^{\prime}$ con $vec(p) in P$

Però in $R^4$ ci sono anche tutti i vettori che non stanno su P, ovvero tutte le combinazioni lineari di ogni singolo vettore p traslato lungo la retta del kernel $alpha*vec(k)$. Quindi $A[p+alphak]=Ap+alphaAk=p^{\prime}$ Perchè $Ak=0$.
Tradotto l'applicazione prende i vettori di $R^4$ che non appartengono a P li proietta ortogonalmente (rispetto alla base che abbiamo scelto) sulla medesima immagine e lungo la direzione del kernel...rendendo sostanzialmente inutile una componente.

L'immagine invece è lo span delle colonne della nostra A e visto che tre di esse sono l.i., allora formano una buona base...ma di tutto $R^3$ (quindi non è una retta).

The big picture generale per vedere gli effetti di una qualsiasi applicazione è questa

Nel nostro caso specifico lo spazio delle righe ha dimensione 3. Il nullspace/kernel ha dimensione 1.
Lo spazio delle colonne/immagine ha dimensione 3. E infine lo spazio nullo sinistro o kernel della trasposta ha dimensione zero perchè è composto dal solo vettore nullo.

mobley
Grazie mille Bokonon! Se tutte le risposte fossero così questo forum avrebbe vita breve!
Dunque se $A$ associata all'applicazione $f:RR^4->RR^3$ genera dimensione dell'immagine pari a 3 e dimensione del kernel pari ad 1, la trasposta $A^T$ associata all'applicazione $f:RR^3->RR^4$ genera dimensione dell'immagine pari a 3 e dimensione del kernel nulla. Banalmente si replica il ragionamento alla trasposta di $A$.

Bokonon
Sottolineo, anche se è un'ovvietà, che la trasposta non è l'inversa (che non esiste in questo caso) ma un'applicazione $g:R^3->R^4$ che "ricrea" SOLO il nostro sottospazio P di $R^4$ e solo grazie al fatto che $dim ker(A^T)=0$ (se invece entrambi i kernel avessero dimansione diversa da zero allora ciccia).
Non ci tengo a parlare delle matrici pseudoinverse (in questo caso $A^-$, ovvero la pseudoinversa destra) ma se tu volessi approfondire allora varrebbe la pena lasciare parlare Strang https://www.youtube.com/watch?v=91QScYCFuy0&t=961s

mobley
@Bokonon: Sostanzialmente la schema che mi hai indicato fornisce una spiegazione per la dimostrazione che segue (che peraltro è di un vecchio esame che ho dato ma senza riuscire a svolgere questo esercizio):



Vediamo se ora riesco a dimostrarlo correttamente.
Io so che $W$ è sottospazio vettoriale di $RR^N$. Quindi siccome lo spazio delle righe è perpendicolare allo spazio delle colonne (il che mi permette di sommare tra loro i due sottospazi) vale il teorema spettrale $N=dim(W)+dim(W^_|_)$, con $dim(W)=dim(Im)$ e $dim(W^_|_)=dim(Ker)$. D'altra parte lo spazio delle righe sotto $RR^N$ coincide con lo spazio delle colonne sotto $RR^M$, per cui abbiamo che $dim(Im)=dim(Im[F])$. Ed essendo di nuovo lo spazio delle colonne perpendicolare allo spazio delle righe, vale il teorema spettrale $M=dim(Im[F])+dim(Ker[F]^_|_)$.

Solo non capisco perchè il segno di perpendicolare anche per la dimensione dell'immagine di $F$...

Probabilmente mi sfugge qualcosa. Tu che ne dici?

Bokonon
@Mobley
Stai mischiando cose giuste e sbagliate
Lo spazio delle righe non è MAI perpendicolare allo spazio delle colonne. In generale stanno persino in spazi completamente diversi...come da immagine.
Inoltre non ci interessa proprio W: serviva solo a ricordare un fatto ovvio.

L'immagine di Strang fornisce la visione geometrica dell'applicazione F (nell'immagine la chiama A).
L'applicazione F generica va da $R^N$ a $R^M$
Lo spazio delle righe non è altro che lo spazio delle colonne della trasposta $C(F^T)$ (giusto per avere un ordine di scrittura).
Lo spazio nullo $N(F)$ è il $ker(F)$, quindi è la soluzione omogenea del sistema $Fx=0$, ergo è per definizione perpendicolare a $C(F^T)$ e quindi sono in somma diretta. Un altro modo per dire che la base composta dallo spazio delle righe di F + la base del kernel di F crea tutto $R^N$..come è ovvio che sia. $dimC(F^T)=rango(F)$

Dall'altra parte invece vediamo lo spazio di arrivo determinato dall'applicazione. Lo spazio delle colonne è l'immagine di F e la sua dimensione è uguale al $rango(F)$ , pertanto l'unica cosa che lega (in generale) lo spazio delle righe e quello delle colonne è che hanno la medesima dimensione $dimC(F^T)=rango(F)=dimC(F)$ che è un altro modo per dire che la matrice associata all'applicazione $F$ e la sua trasposta $F^T$ hanno il medesimo rango. Fatto ovviamente dimostrabile e dimostrato.
Infine, lo spazio nullo di $F^T$, ovvero $ker(F^T)$ è perpendicolare allo spazio delle colonne/immagine.

Detto questo, la "soluzione geometrica" dell'esercizio è immediata.
$Ker[F]^_|_$ altro non è che lo spazio delle righe di F, ovvero $C(F^T)$
Mentre $Im[F]^_|_$ è semplicemente lo spazio nullo della trasposta $N(F^T)=ker(F^T)$
Come abbiamo detto sopra $dimC(F^T)=rango(F)=dimC(F)$
Quindi prendendo le dimensioni dei 4 spazi fondamentali come da immagine, abbiamo
$dim(Im[F]^_|_)+dim(Ker[F]^_|_)=dimN(F^T)+dimC(F)=r+m-r=m$

mobley
Grazie davvero Bokonon, oggi mi sono studiato con calma la tua risposta e credo di essere riuscito a riassumere quanto mi hai detto. Domani la scrivo così magari (se ancora tieni questa vena masochista :D) potrai correggermi!

Bokonon
Volentieri. Alla fine puoi anche dimostrarlo in due righe. E' semplicemente il teorema rango+nullità applicato alla trasposta.
Quindi basta collegare gli spazi e invocare il teorema.

mobley
"Bokonon":
Volentieri. Alla fine puoi anche dimostrarlo in due righe. E' semplicemente il teorema rango+nullità applicato alla trasposta.
Quindi basta collegare gli spazi e invocare il teorema.


Ti ringrazio per la consueta disponibilità. Allora… Questo è ciò che ho scritto in base alle tue spiegazioni e che (a meno di errori) scriverò in caso lo chieda.

Io so che lo spazio delle righe della matrice $A$ associata alla funzione $F(a+b,c+d,e+f)$ non è altro che lo spazio delle colonne della sua trasposta. Infatti $ A=[ ( a , b ),( c , d ),( e , f ) ] rArrA^T=[ ( a , c , e ),( b , d , f ) ] $, con $R(F[A])=C(F[A^T])=3$.
So anche che il $Ker[F]$ si ottiene come soluzione del sistema omogeneo $F(a+b,c+d,e+f)=\bar(0)$, quindi dovrà essere ortogonale rispetto alle colonne di $A^T$. Ortogonalità implica sommabilità, per cui se è vero che $dim(Im[F])=dim(Im[F^T])=max(rango)$ dovuta all'uguaglianza righe-colonne, è altrettanto vero che per $Ker[F]_|_dim(Im[F^T])$ si può scrivere $dim(Im[F])+dim(Ker[F])=RR^N$.

Peraltro, siccome da $Ker[F]_|_dim(Im[F^T])$, vale per differenza $Im[F]_|_Ker[F^T]$). Allora:
$dim(Ker[F]^(_|_))+dim(Im[F]^(_|_))=dim(Im[F^T])+dim(Ker[F^T])=dim(Im[F])+dim(Ker[F^T])$


Assumendo quindi che
1) $RR^N$ abbia $N=N$
2) $RR^M$ abbia $M=M$
3) $dim(Im[F])=r$
risulta:
$dim(Ker[F]^(_|_))+dim(Im[F]^(_|_))=dim(Im[F])+dim(Ker[F^T])=r+(M-r)=M$

Bokonon
Ok, ma se è per l'esame allora è preferibile usare la terminologia "italiana" ed essere un minimo più formali.
Io farei semplicemente così: innanzitutto richiamerei il teorema di rango + nullità.

Data $F$, matrice associata ad un'applicazione f, di dimensioni (mxn), il teorema ci dice che $dimKer(F)+dimIm(F)=n$
Considerando l'applicazione trasposta $F^T$, che avrà dimensioni (nxm), il teorema afferma che:
$dimKer(F^T)+dimIm(F^T)=m$ (1)

$Ker(F)$ è lo spazio vettoriale composto da tutti i vettori v tali che $Fv=0$, pertanto è perpendicolare allo spazio generato dalle combinazioni lineari delle colonne di $F^T$, ovvero l'immagine della trasposta: da cui segue che $Im(F^T)=Ker(F)^_|_$

$Im(F)$ è lo spazio generato dalle combinazioni lineari delle colonne di $F$, pertanto $Im[F]^_|_$ e lo spazio generato dai vettori w che soddisfano l'equazione omogenea $F^Tw=0$, ovvero $Im[F]^_|_=Ker(F^T)$
Sostituendo nella (1) abbiamo il risultato.

Bokonon
Nota bene: in Italia non insegnano i quattro spazi fondamentali di Strang e usiamo Ker(F) per indicare lo spazio nullo e Im(F).
Va bene usare the big picture per visualizzare immediatamente di cosa parla un problema ma poi usa la terminologia italiana e richiama i dovuti teoremi.
Per esempio il teorema di nullità + rango mette in relazione le dimensioni del kernel e dell'immagine: due spazi che, in generale, sono generati da basi composte dal medesimo numero di vettori ma che hanno un diverso numero di componenti. Va da se che il teorema è vero perchè la dimensione dell'immagine è pari al rango della matrice e che il $rk(F)=rk(F^T)$, come hai evidenziato...ma non è necessario fare questo passaggio.

mobley
Grazie infinite Bokonon!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.