Confronto fra medie multivariate

ghtmtt
Ciao a tutti.
Sto affrontando un problema di statistica multivariata. I dati che ho si riferiscono a due stati americani, per ognuno dei quali ho 12 misure di 3 variabili diverse (se può interessare sono 3 inquinanti provenienti dagli scarichi delle automobili).

Mi è richiesto di effettuare un test per verificare se è possibili trattare i due stati come una singola popolazione. Ho affrontato il problema con la lambda di Wilks ed effettivamente, sia al 95% che al 99%, rifiuti l'ipotesi nulla di uguale popolazione e posso affermare che i due stati sono in realtà popolazioni distinte.

A questo punto mi viene richiesto di effettuare un test sulle medie delle singole variabili per capire quali sono quelle che maggiormente influiscono sulla differenziazione delle due popolazioni. Ho pensato che potesse essere utile fare un test con la t di student: e qui c'è il nodo della questione. Affrontate singolarmente, il test di student per tutte e tre le variabili mi permette di accettare l'ipotesi nulla, ovvero che non c'è differenza fra le medie della variabile per le due popolazioni.

So che un approccio multivariato è più potente di tre univariati presi singolarmente, però come faccio a capire quale delle tre variabili è maggiormente responsabile della distinzione delle popolazioni??

Risposte
niandra82
Io al tuo posto adotterei un modello logistico, inserendo le tre variabili e tramite procedure "step" decidere quale variabile è più "significativa", facendo attenzione alla collinearità.

ghtmtt
Cosa intendi per modello logistico?
Se riesci a darmi qualche dettaglio in più te ne sarei grato..

niandra82
Se non sai cos'è un modello logistico mi risulta veramente difficile spiegarlo quì.http://it.wikipedia.org/wiki/Modello_logit

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.