Statistica multivariata
Ciao a tutti!
Allora , ho tradotto un libro dall'inglese per una parte della mia tesi.
Gli argomenti sono Analisi fattoriale ed Analisi in componenti principali. Secondo il libro queste due cose sono distinte ,infatti le tratta in modo diverso e in più dedica una sezione alle differenze tra le due metodologie e ai privilegi di una e dell'altra.
Cercando dell'altro materiale in internet, ho trovato invece la seguente "classificazione" (sul sito di un università torinese,quindi affidabile!):
L'Analisi fattoriale si divide in questo modo:
-analisi in componenti principali (per variabili quantitative)
-analisi delle corrispondenze (variabili qualitative)
-analisi delle corrispondenze multiple (per entrambi i tipi di variabili)
O_O a me non convince molto, cose ne pensate?
Allora , ho tradotto un libro dall'inglese per una parte della mia tesi.
Gli argomenti sono Analisi fattoriale ed Analisi in componenti principali. Secondo il libro queste due cose sono distinte ,infatti le tratta in modo diverso e in più dedica una sezione alle differenze tra le due metodologie e ai privilegi di una e dell'altra.
Cercando dell'altro materiale in internet, ho trovato invece la seguente "classificazione" (sul sito di un università torinese,quindi affidabile!):
L'Analisi fattoriale si divide in questo modo:
-analisi in componenti principali (per variabili quantitative)
-analisi delle corrispondenze (variabili qualitative)
-analisi delle corrispondenze multiple (per entrambi i tipi di variabili)
O_O a me non convince molto, cose ne pensate?
Risposte
Diciamo che l'analisi fattoriale e l'analisi delle componenti principali sono legate fra loro, come dire "appartengono alla stessa famiglia", in quanto hanno un obiettivo unico: rappresentare nei migliori un fenomeno $k$-dimensionale. L'unica differenza è che
a) l'analisi delle componenti principali intende rappresentare il fenomeno $k$-dimensionale mediante un numero inferiore o uguale a $k$ di variabili incorrelate, ottenute mediante opportune trasformazioni delle variabili osservate (H. Hotelling)
b) l'analisi fattoriale, invece, intende rappresentare il fenomeno $k$-dimensionale cercando di spiegare l’interdipendenza esistente tra un complesso numero di variabili mediante un esiguo numero di fattori incorrelati tra loro.
La differenza sostanziale, quindi, è che l'analisi fattoriale non è volta alla trasformazione delle variabili osservate e nella loro relativa sintesi, bensì è volta a stimare un modello che riproduca la struttura della covarianza tra le stesse.
ok?
a) l'analisi delle componenti principali intende rappresentare il fenomeno $k$-dimensionale mediante un numero inferiore o uguale a $k$ di variabili incorrelate, ottenute mediante opportune trasformazioni delle variabili osservate (H. Hotelling)
b) l'analisi fattoriale, invece, intende rappresentare il fenomeno $k$-dimensionale cercando di spiegare l’interdipendenza esistente tra un complesso numero di variabili mediante un esiguo numero di fattori incorrelati tra loro.
La differenza sostanziale, quindi, è che l'analisi fattoriale non è volta alla trasformazione delle variabili osservate e nella loro relativa sintesi, bensì è volta a stimare un modello che riproduca la struttura della covarianza tra le stesse.
ok?

Infatti , io ho strutturato la mia tesi in questo modo,
-introduzione alla teoria delle multinormali
-decomposizione della matrice dei fattori
-analisi in componenti principali
-analisi fattoriale
-analisi dei dati con R
-....
Come vedi,addirittura l'analisi fattoriale viene DOPO a quella in componenti principali , quindi proprio due cose "diverse" come di ci tu....
Vabbè , grazie! io vado avanti secondo la mia convinzione...
-introduzione alla teoria delle multinormali
-decomposizione della matrice dei fattori
-analisi in componenti principali
-analisi fattoriale
-analisi dei dati con R
-....
Come vedi,addirittura l'analisi fattoriale viene DOPO a quella in componenti principali , quindi proprio due cose "diverse" come di ci tu....
Vabbè , grazie! io vado avanti secondo la mia convinzione...
Concordo con Aliseo. Aggiungo solo una cosa: nell'analisi in componenti principali il numero di assi, che vengono presi in esame, è sempre in numero inferiore al numero di variabili di partenza (nella pratica intendo). Questo perché negli ultimi assi principali vanno a finire le "sporcizie", cioè le componenti di errore: quindi è buona norma non prenderli. Per selezionare il numero corretto si deve osservare la varianza spiegata cumulata e da qui fare la scelta: comunque già i primi 2 solitamente spiegano già molto. Si usa solo per variabili quantitative.
Sull'analisi delle corrispondenze semplici e multiple: questa si fa con dati qualitativi, ma puoi farla anche con dati qualitativi se porti i valori in classi modali. La distanza che si usa non è quella euclidea (e questo è ovvio perché hai dati qualitativi), ma è la metrica del Chi-quadro ideata da Benzecrì (pernso si scrivi così).
Ciao
p.s: se usi R uno dei pacchetti più utili è factoMineR, per l'ACP ed il clustering è fatto benissimo.
Sull'analisi delle corrispondenze semplici e multiple: questa si fa con dati qualitativi, ma puoi farla anche con dati qualitativi se porti i valori in classi modali. La distanza che si usa non è quella euclidea (e questo è ovvio perché hai dati qualitativi), ma è la metrica del Chi-quadro ideata da Benzecrì (pernso si scrivi così).
Ciao
p.s: se usi R uno dei pacchetti più utili è factoMineR, per l'ACP ed il clustering è fatto benissimo.
Grazie delle indicazioni su R. Vuoi sapere una cosa? In realtà la tesi è già finita , la sto correggendo e preparando la presentazione
Mi è venuta un attimo l'angoscia perchè pensavo di aver sbagliato tutto!!!!!
Cmq c'è un teorema che devo finire di dimostrare e penso che mi srvirà una mano...appena mi ricordo come scrivere le formule,lo posto.
Grazie a entrambi

Mi è venuta un attimo l'angoscia perchè pensavo di aver sbagliato tutto!!!!!
Cmq c'è un teorema che devo finire di dimostrare e penso che mi srvirà una mano...appena mi ricordo come scrivere le formule,lo posto.
Grazie a entrambi

figurati, cmq il teorema a quale argomento si riferisce?
L'ambito è sempre quello delle componenti principali , le proprietà asintotiche in particolare.
un Teorema è:
Sia $\Sigma >0$ con autovalori non coincidenti, e sia $U\sim m^{-1}W_p(\Sigma,m)$ ($W$ è una Wishart) con decomposizione spettrale $\Sigma=\Gamma\Lambda\Gamma^T$ e $U=GLG^T$. Allora:
-) $\sqrt m(l-\lambda)\rightarrow N_p(0,2\Gamma^2)$ dove $l=(l_1,...,l_p)$ e $\lambda=(\lambda_1,...,\lambda_p)^T$ sono le diagonali di L e $\Gamma$
-)$\sqrt m(g_j-\gamma_j)\rightarrow N_p(0,\nu_j) $ con$\nu_j=\lambda_j \sum_{k\neq j} \frac{\lambda_k}{(\lambda_k-\lambda_j)^2 }\gamma_k\gamma_k^T$
-)$Cov(g_j,g_k)=\nu_{jk} $ dove $(r,s)$-esimo elemento della matrice $\nu_{jk}(p\times p)$ è $-\frac{\lambda_j\lambda_k\gamma_{rk}\gamma_{sj}}{[m(\lambda_j-\lambda_k)^2]}$
-) gli elementi in $l$ sono asintoticamente indipendenti dagli elementi in $G$.
Ho pensato che nel primo punto sia importante il fatto che gli autovalori non sono coincidenti e che $\Sigma>0$ , però non so come arrivare alla conclusione che abbia distribuzione $N_p(0,2\Gamma^2)$.
Questo è il primo teorema che mi dà problemi.
un Teorema è:
Sia $\Sigma >0$ con autovalori non coincidenti, e sia $U\sim m^{-1}W_p(\Sigma,m)$ ($W$ è una Wishart) con decomposizione spettrale $\Sigma=\Gamma\Lambda\Gamma^T$ e $U=GLG^T$. Allora:
-) $\sqrt m(l-\lambda)\rightarrow N_p(0,2\Gamma^2)$ dove $l=(l_1,...,l_p)$ e $\lambda=(\lambda_1,...,\lambda_p)^T$ sono le diagonali di L e $\Gamma$
-)$\sqrt m(g_j-\gamma_j)\rightarrow N_p(0,\nu_j) $ con$\nu_j=\lambda_j \sum_{k\neq j} \frac{\lambda_k}{(\lambda_k-\lambda_j)^2 }\gamma_k\gamma_k^T$
-)$Cov(g_j,g_k)=\nu_{jk} $ dove $(r,s)$-esimo elemento della matrice $\nu_{jk}(p\times p)$ è $-\frac{\lambda_j\lambda_k\gamma_{rk}\gamma_{sj}}{[m(\lambda_j-\lambda_k)^2]}$
-) gli elementi in $l$ sono asintoticamente indipendenti dagli elementi in $G$.
Ho pensato che nel primo punto sia importante il fatto che gli autovalori non sono coincidenti e che $\Sigma>0$ , però non so come arrivare alla conclusione che abbia distribuzione $N_p(0,2\Gamma^2)$.
Questo è il primo teorema che mi dà problemi.
Mi incuriosisce una cosa: perché ti interessano le distribuzioni degli autovalori? In fondo l'analisi in componenti principali fa parte di quel ramo della statistica basato più sulla geometria che sulla probabilità, quindi a che "pro" mettersi a lavorare sulle distribuzioni?
La cosa è molto interessante, soprattutto se effettivamente possa servire nella pratica. Se non ricordo male so che se si ipotizza la normalità, allora nelle ultime componenti vanno a finire gli errori per cui è sempre meglio non prenderle sia per il clustering che per regressioni robuste.
Ciao
La cosa è molto interessante, soprattutto se effettivamente possa servire nella pratica. Se non ricordo male so che se si ipotizza la normalità, allora nelle ultime componenti vanno a finire gli errori per cui è sempre meglio non prenderle sia per il clustering che per regressioni robuste.
Ciao
Perchè la debba essere fatta la dimostrazione,non lo so,so solo che mi è stato detto di farlo...
cmq nel suo piccolo un senso ce l'ha,infatti per trovare le Cp,devo trovare le proiezioni che massimizzano la varianza,e poi si procede con gli autovalori....
La varianza spiegata dai primi $q$ delle CP è data da $\psi=frac{\lambda_1+...+\lambda_q}{sum_{j=1}^p \lambda_j}$
In pratica questo è stimato da $\hat\psi=frac{l_1+...+l_p}{sum_{j=1}^p l_j}$.
cmq nel suo piccolo un senso ce l'ha,infatti per trovare le Cp,devo trovare le proiezioni che massimizzano la varianza,e poi si procede con gli autovalori....
La varianza spiegata dai primi $q$ delle CP è data da $\psi=frac{\lambda_1+...+\lambda_q}{sum_{j=1}^p \lambda_j}$
In pratica questo è stimato da $\hat\psi=frac{l_1+...+l_p}{sum_{j=1}^p l_j}$.
Scusa ma non capisco una cosa. Quando fai l'ACP, dato che minimizzi l'errore di proiezione delle unità statistiche sugli assi principali, usi il metodo dei minimi quadrati vincolati e per questo non hai bisogno di conoscere nessuna distribuzione. Per la varianza spiegata, dato che lavori sulla matrice di correlazione, usi il rapporto tra l'autovalore ed il numero di variabili e anche qui la distribuzione non ti serve.
Tu su che matrice fai l'ACP?
Tu su che matrice fai l'ACP?
Perchè stiamo parlando di una tesi di laurea e questo teorema l'ho riportato (su consiglio del prof),allora lui ha detto che bisognerebbe fare anche la dimostrazione,quindi che serva veramente poi per il procedimento oppure no, non è importante! sta di fatto che devo fare questa dimostrazione....
@ deggianna: solo una curiosità, dove hai trovato questo teorema?
@ olaxgabry: statistico pure tu?
@ olaxgabry: statistico pure tu?
"deggianna":
Perchè stiamo parlando di una tesi di laurea e questo teorema l'ho riportato (su consiglio del prof),allora lui ha detto che bisognerebbe fare anche la dimostrazione,quindi che serva veramente poi per il procedimento oppure no, non è importante! sta di fatto che devo fare questa dimostrazione....
Che si tratti di un teorema e che ti serva la dimostrazione non lo metto in dubbio, ero e rimango molto interessato sul perché delle distribuzioni. Io mi sono fatto questa idea: credo che sia semplicemente un altro modo di vedere il problema (un pò come nei metodi di stima dei parametri di un modello di regressione "classico"). Io l'ACP la vedo come quella parte della statistica che si serve esclusivamente o prevalentemente della geometria (non solo quella euclidea), però il tuo approccio mi incuriosisce molto: magari chiedi anche al tuo prof, se ne hai voglia, del motivo di sapere le distribuzioni per fini pratici perché a qualcosa dovrà servire.
@ Aliseo: la statistica mi appassiona molto, soprattutto l'analisi dei dati e l'econometria. Però non sono proprio uno statistico (nel senso che ho studiato altro).
@ Aliseo : Per una parte della tesi,ho tradotto un libro (dall'inglese),[\b]Statistics - Applied Multivariate Statistical Analysis - By Wolfgang Hardle & Simar.
Ovvio che poi chiederò al prof,anche perchè le dimostrazioni di statistica non sono proprio così immediate come quelle di algebra/analisi/geometria...
Cmq la parte delle CP è solo un capitolo,quindi non è tutta la tesi,e quindi il teorema mi serve...mi serve poi per alcuni teoremi che ci sono dopo che fanno riferimento a questo (quindi alle proprietà asintotiche delle CP).
Cmq da quanto ho capito nessuno è in grado di darmi una mano
Ovvio che poi chiederò al prof,anche perchè le dimostrazioni di statistica non sono proprio così immediate come quelle di algebra/analisi/geometria...
Cmq la parte delle CP è solo un capitolo,quindi non è tutta la tesi,e quindi il teorema mi serve...mi serve poi per alcuni teoremi che ci sono dopo che fanno riferimento a questo (quindi alle proprietà asintotiche delle CP).
Cmq da quanto ho capito nessuno è in grado di darmi una mano

Io ti proponevo di chiedergli soprattutto l'uso pratico del sapere le distribuzioni. Poi chiaramente anche sul teorema; il discorso è che non avendo il libro sotto mano è difficile aiutarti, magari prova a postare la pagina e vediamo cosa si può fare.
Nessuno mi può aiutare era riferito anche alle persone che conosco purtroppo 
Cmq non importa,domani vedo il prof e sento cosa si può fare,anche perchè la mia tesi deve essere FINITA pe venerdì prossimo...

Cmq non importa,domani vedo il prof e sento cosa si può fare,anche perchè la mia tesi deve essere FINITA pe venerdì prossimo...