ACP - Funzione obiettivo per la determinazione del I° asse
Buongiorno,
nell'analisi delle componenti principali l'obiettivo è spiegare le relazioni tra le n variabili originarie tramite un minor numero di variabili tra loro non correlate. A questo risultato si arriva attraverso la determinazione delle cosiddette componenti principali.
La prima componente principale equivale a determinare il miglior asse sul quale la distanza tra tutte le coppie di punti proiettati sia massima, cioè ad minimizzarne la distorsione.
Di seguito vi riporto la funzione obiettivo: $ sum_(i ) sum_(j ) (tildeei-tildeej)^2 = max $
Quindi:
$ sum_(i ) sum_(j ) (tildeei-tildeej)^2 = $ $ nsum_(i )tildee_i^2 + nsum_(j )tildee_j^2 - 2sum_(i)tildee_isum_(j)tildee_j $
$ = $ $ 2(nsum_i tildee_i^2) -2(sum_i tildee_i)^2 = $ $ 2n^2[1/2 sum_i tildee_i^2 - 1/n^2(sum_i tildee_i)^2] $ = $ $ 2n^2 var(tildee_i) $ = 2n^2[1/n sum_i(tildee_i - tildebare_i)^2 ] = $ $ 2nsum_i(tildee_i-tildebare_i)^2 $
Vorrei sapere come fa ad arrivare all'inizio del secondo rigo? come mai le $ tildee_j $ "scompaiono"?
nell'analisi delle componenti principali l'obiettivo è spiegare le relazioni tra le n variabili originarie tramite un minor numero di variabili tra loro non correlate. A questo risultato si arriva attraverso la determinazione delle cosiddette componenti principali.
La prima componente principale equivale a determinare il miglior asse sul quale la distanza tra tutte le coppie di punti proiettati sia massima, cioè ad minimizzarne la distorsione.
Di seguito vi riporto la funzione obiettivo: $ sum_(i ) sum_(j ) (tildeei-tildeej)^2 = max $
Quindi:
$ sum_(i ) sum_(j ) (tildeei-tildeej)^2 = $ $ nsum_(i )tildee_i^2 + nsum_(j )tildee_j^2 - 2sum_(i)tildee_isum_(j)tildee_j $
$ = $ $ 2(nsum_i tildee_i^2) -2(sum_i tildee_i)^2 = $ $ 2n^2[1/2 sum_i tildee_i^2 - 1/n^2(sum_i tildee_i)^2] $ = $ $ 2n^2 var(tildee_i) $ = 2n^2[1/n sum_i(tildee_i - tildebare_i)^2 ] = $ $ 2nsum_i(tildee_i-tildebare_i)^2 $
Vorrei sapere come fa ad arrivare all'inizio del secondo rigo? come mai le $ tildee_j $ "scompaiono"?
Risposte
Non scompare nulla...ha solo scritto le cose diversamente. Ad esempio
$Sigma_itilde(e)_i*Sigma_jtilde(e)_j=[Sigma_itilde(e)_i]^2$
Invece c'è qualche refuso nei passaggi successivi...dentro la parentesi quadra ci va $1/n$ e non $1/2$
Inoltre, senza fare altri passaggi ma utilizzando la definizione di varianza campionaria , già al secondo passaggio dovresti vedere il risultato. Infatti dentro la prima parentesi quadra hai già $E(X^2)-E^2(X)=V(X)$
Nella media finale degli $tilde(e)$ non mi pare ci vada il pedice rispetto ad $i$...essendo la media.
Per capire i passaggi tieni presente che la doppia somma iniziale è la somma degli elementi di una matrice quadrata $n xx n$
$Sigma_itilde(e)_i*Sigma_jtilde(e)_j=[Sigma_itilde(e)_i]^2$
Invece c'è qualche refuso nei passaggi successivi...dentro la parentesi quadra ci va $1/n$ e non $1/2$
Inoltre, senza fare altri passaggi ma utilizzando la definizione di varianza campionaria , già al secondo passaggio dovresti vedere il risultato. Infatti dentro la prima parentesi quadra hai già $E(X^2)-E^2(X)=V(X)$
Nella media finale degli $tilde(e)$ non mi pare ci vada il pedice rispetto ad $i$...essendo la media.
Per capire i passaggi tieni presente che la doppia somma iniziale è la somma degli elementi di una matrice quadrata $n xx n$
Ok, le tue osservazioni sono corrette, in effetti ho trascritto male dal libro.
Quindi i vettori riga e colonna della matrice dei punti-unità, o delle variabili, a seconda dello spazio in cui operiamo, sono l'uno il trasposto dell'altro?
"tommik":
Per capire i passaggi tieni presente che la doppia somma iniziale è la somma degli elementi di una matrice quadrata n×n
Quindi i vettori riga e colonna della matrice dei punti-unità, o delle variabili, a seconda dello spazio in cui operiamo, sono l'uno il trasposto dell'altro?