ACP - Funzione obiettivo per la determinazione del I° asse

Fai una domanda Tutte le categorie

hubble1

30 giu 2018, 12:10

Buongiorno,

nell'analisi delle componenti principali l'obiettivo è spiegare le relazioni tra le n variabili originarie tramite un minor numero di variabili tra loro non correlate. A questo risultato si arriva attraverso la determinazione delle cosiddette componenti principali.
La prima componente principale equivale a determinare il miglior asse sul quale la distanza tra tutte le coppie di punti proiettati sia massima, cioè ad minimizzarne la distorsione.

Di seguito vi riporto la funzione obiettivo: $ sum_(i ) sum_(j ) (tildeei-tildeej)^2 = max $

Quindi:

$ sum_(i ) sum_(j ) (tildeei-tildeej)^2 = $ $ nsum_(i )tildee_i^2 + nsum_(j )tildee_j^2 - 2sum_(i)tildee_isum_(j)tildee_j $
$ = $ $ 2(nsum_i tildee_i^2) -2(sum_i tildee_i)^2 = $ $ 2n^2[1/2 sum_i tildee_i^2 - 1/n^2(sum_i tildee_i)^2] $ = $ $ 2n^2 var(tildee_i) $ = 2n^2[1/n sum_i(tildee_i - tildebare_i)^2 ] = $ $ 2nsum_i(tildee_i-tildebare_i)^2 $

Vorrei sapere come fa ad arrivare all'inizio del secondo rigo? come mai le $ tildee_j $ "scompaiono"?

Risposte

Lo_zio_Tom

30 giu 2018, 11:19

Non scompare nulla...ha solo scritto le cose diversamente. Ad esempio

$Sigma_itilde(e)_i*Sigma_jtilde(e)_j=[Sigma_itilde(e)_i]^2$

Invece c'è qualche refuso nei passaggi successivi...dentro la parentesi quadra ci va $1/n$ e non $1/2$

Inoltre, senza fare altri passaggi ma utilizzando la definizione di varianza campionaria , già al secondo passaggio dovresti vedere il risultato. Infatti dentro la prima parentesi quadra hai già $E(X^2)-E^2(X)=V(X)$

Nella media finale degli $tilde(e)$ non mi pare ci vada il pedice rispetto ad $i$...essendo la media.

Per capire i passaggi tieni presente che la doppia somma iniziale è la somma degli elementi di una matrice quadrata $n xx n$

hubble1

30 giu 2018, 13:15

Ok, le tue osservazioni sono corrette, in effetti ho trascritto male dal libro.

"tommik":
Per capire i passaggi tieni presente che la doppia somma iniziale è la somma degli elementi di una matrice quadrata n×n

Quindi i vettori riga e colonna della matrice dei punti-unità, o delle variabili, a seconda dello spazio in cui operiamo, sono l'uno il trasposto dell'altro?

Rispondi

Per rispondere a questa discussione devi prima effettuare il login.

ACP - Funzione obiettivo per la determinazione del I° asse

Segnala Post di