Metodi di discesa

raff5184
in analisi numerica, riguardo ai metodi di disesa, graficamente come vengono scelte le direzioni di discesa?
Per esempio per il metodo del gradiente tutti i grafici che ho visto sono in 2D, ma le direzioni di discesa giacciono nel piano delle ellissi o le rette che individuano le direzioni di discesa hanno 3 dimensioni?

Risposte
*pizzaf40
L'ellissi ceh si forma per poter risolvere il metodo del gradiente è un ellissi n-dimensionale L'hai sempre visto in 2D perchè è difficile disegnarlo in maniera chiara in nD.
Quindi tu devi immaginarti un'ellissi n-dim (difficilissimo da immaginare...meglio 3D) di cui tu prendi il gradiente, cioè la perpendicolare alla superficie ellittica, e vai in quella direzione (che sarà descritta da un vettore n-dim) trovando il punto in cui il valore è minimo...quindi il più vicino al centro dell'ellissi (il centro è infatti la soluzione per come è posto il problema). Iteri in questa maniera finchè non arrivi ad un'approssimazione sufficiente del centro.

Il gradiente coniugato modificato, infatti, ha lo scopo di trasformate l'ellissi 3D in una sfera (ipersferoide per l'inimmaginabili n-dim) perchè così il gradiente (che è sempre la direzione perpendicolare alla superficie) risulterà coincidente col raggio, ed il centro verrà raggiunto teoricamente in una sola iterazione!!

Il fatto che in realtà non sia così è un altro discorso.

Ciao!!

raff5184
"pizzaf40":
L'ellissi ceh si forma per poter risolvere il metodo del gradiente è un ellissi n-dimensionale

Ciao innanzi tutto grazie per la risposta.

Ma l'ellissi (se parliamo di 3 dimensioni ovviamente) non è la sezione del paraboloide? (iperparaboloide in n dimensioni) E pertanto, il gradiente è ortogonale alla superficie del paraboloide e giace nel piano dell'ellissi

*pizzaf40
Ola...sono tornato ora dall'uni!

Se ti devo dire la verità, non ho capito la domanda.ora ti spiego xke...
Il problema è impostato sulla minimizzazione dell'errore al quadrato o del residuo al quadrato...nel caso del gradiente, si cerca di minimizzare l'errore per il residuo (che quindi, nel discreto, coincide con errore* matrice*errore).

Se la matrice è simmetrica definita positiva (disgraziatamente non so dirti per gli alri casi, in quanto non sono stati affrontati nell'esame che avevo fatto io), questa moltiplicazione è sempre $ge0$ ed è ovviamente uno scalare...inoltre, sviluppando i calcoli in 2D (per $eAe=cost$ cioè curva di livello della funzione da minimizzare)(non so fare gli apici, quindi non c'è il "trasposto" sul primo vettore) la formula risultante è palesemente quella di un'ellisse (o ellissi...boh) :-D quindi è una curva chiusa, di cui si deve trovare il centro per avere la soluzione (di cui, quindi prendi il grad...minimizzi in quella direzione...prendi il punto risultante...quindi la curva di livello per quel punto...prendi il grad...minim...ecc...ecc).

Non so quindi cosa intendi per parabola (-oide)...il problema è caratterizzato da una curva (2D) o superficie (3D) chiusa...non la sezione di qualcosa di aperto. In 3D devi immaginarti un uovo più o meno schiacciato (affusolato) in cui scegli un punto a caso, punti l'interno i9n direzione grad, ti fermi in un altro punto più vicino al centro che puoi, prendi la superficie a uovo che passa per lì, e prendi il nuovo grad...ecc.
Per questo se precondizioni (GCM) va meglio...perchè l'uovo diventa sfera!!
Il GC, invece A-ortogonalizza il vettore che prima era il grad...cioè, al primo passo prendi il grad, vai in quella direz e trovi il min...a quel punto non prendi la direzione grad della nuova superficie di livello che hai trovato, perchè c'è il pericolo che in quella direzione ti avvicini in generale, ma tornando leggermente indietro rispetto alla direzione del primo passo, aumentando quindi l'errore che avevi appena azzerato ( direzione grad del primo passo) tentando di azzerarne un altro (direzione grad secondo passo)!! A-ortogonalizzare la direzione di avvicinamento significa proprio impedire che questo succeda...cioè rendere linearmente indipendenti rispetto ad A le direzioni di avvicinamento alla soluzione. In questa maniera, teoricamente, si deve ottenere la soluzione esatta in un numero di iterazioni massimo uguale alla dimensione del problema ($n°itccmccaccx=n$)

Per questo non capisco cosa centra il paraboloide...se lo scopo fosse quello di trovare il vertice del paraboloide, il grad non funzionerebbe, perchè la direzione normale alla superficie di una parabola non si avvicina al vertice.

Spero di non aver sparato una marea di castronate :-D ma io ho capito così...

raff5184
"pizzaf40":

nel caso del gradiente, si cerca di minimizzare l'errore per il residuo (che quindi, nel discreto, coincide con errore* matrice*errore).

Se la matrice è simmetrica definita positiva, questa moltiplicazione è sempre $ge0$

Se è SPD non è $>0$?

"pizzaf40":

sviluppando i calcoli in 2D (per $eAe=cost$ cioè curva di livello della funzione da minimizzare

Se parli di curve di livello stai parlando delle sezioni (e pertanto 2D) di una funzione 3D; sezioni su cui quella funzione 3Dè costante.
Qual è questa funzione da minimizzare? Secondo me è appunto quella che io ho chiamato paraboloide.

Ora, come hai detto anche tu queste sezioni sono ellissi, infatti prendi un parabolide e guardalo dall'alto, cosa vedi? Una concava... Come la rappresenti dall'alto? Tramite le curve di livello che sono delle ellissi.


"pizzaf40":

quindi è una curva chiusa, di cui si deve trovare il centro per avere la soluzione (di cui, quindi prendi il grad...minimizzi in quella direzione


E' qui il mio dubbio, hai parlato di una direzione, ossia di una retta, in quale piano giace questa retta?? Nel piano contenente tutte le curve di livello?


"pizzaf40":

Non so quindi cosa intendi per parabola (-oide)...il problema è caratterizzato da una curva (2D) o superficie (3D) chiusa...non la sezione di qualcosa di aperto. In 3D devi immaginarti un uovo più o meno schiacciato (affusolato)

Ok mi ritrovo con questa tua affermazione, infatti, il mio paraboloide 3D non è l'uovo. Il paraboloide è la funzione di cui vado a prendere le curve di livello, cioè gli ellissi 2D. (A proposito ellisse o ellissi si possono usare entrambi)
Se invece prendo un iperparaboloide le funzioni su cui lavoro sono le :-D ;mi ritrovo cn quanto hai scritto!

"pizzaf40":

Spero di non aver sparato una marea di castronate :-D ma io ho capito così...

A me non pare proprio, mi ritrovo son i tuoi ragionamenti. Sei stato chiaro... Solo hai tralasciato proprio i punti che volevo sapere :lol:

*pizzaf40
Ah, ho capito quello che intendi...non c'avevo pensato!!
In effetti non mi ero mai posto il problema di capire il senso della funzione da minimizzare a partire dalla forma della sua curva di livello :roll:

Intuitivamente la storia della parabola 3D per la funzione che caratterizza la soluzione del problema 2D ci può stare!! E l'abbassarsi dell'errore fa solo pensare a quel tipo di rappresentazione ma ci dovrei pensare un po'..................................................................................................................................................................................
......................................................................................................................................................................................
...................................................SI', confermo!!!! Sono d'accordo con te. Sì sì sì!!!!
Sono del tuo parere appieno!!
a è un caso ceh tu abbia per mano questo argomento o fai anche tu l'uni a pd??? O su che libro stai studiando??

raff5184
"pizzaf40":

Intuitivamente la storia della parabola 3D per la funzione che caratterizza la soluzione del problema 2D ci può stare!!

in realtà questo può essere dimostrato che viene proprio cosi se A è SPD

"pizzaf40":

a è un caso ceh tu abbia per mano questo argomento o fai anche tu l'uni a pd??? O su che libro stai studiando??


No, non è un caso, sto preparando l'esame di "metodi numerici per l'elettromagnetismo". Non faccio l'uni a PD, ma sto a Benevento.

Come libro ho usato prevalentemente, per la parte di algebra e algoritmi, il Valeriano Comincioli. Per l'algebra teorica, invece, il Serge Lang, e poi Sadiku e Taflove per MOM e FDTD

*pizzaf40
Allora no, non c'è neanche il testo in comune, però le problematiche sono le stesse...in definitiva ti ringrazio io perchè mi hai fatto notare una cosa in più. Non me la chiederanno mai :-D però èquesto in bello della cultura personale!
Ciao...stammi bene!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.