[Statistica] Analisi Dati
buongiorno a tutti, sono arrivato su questo [size=85][riferito a questo ndmod][/size] thread facendo una ricerca con google, dato che mi trovo in una situazione molto simile a quella di Cri (con alcune differenze, ovviamente). Mi permetto dunque di postare nello stesso thread, sperando che i consigli dati a lei o a me possano essere "intercambiabili".
Riassumo il mio caso.
Mi trovo a svolgere una indagine di mercato simulata (influenti per la scelta di un prodotto). Ho SEI opzioni diverse, ognuna delle quali è valutabile da 1 (influenza minima) a 7 (influenza massima). Non c'è vincolo nell'assegnare valutazioni, cioè posso dare anche tutti 1 o tutti 7, l'importante è che assegni ad ogni fattore un punteggio.
Gli intervistati hanno diverse provenienze (negozi di diverso tipo), diverse età, una spesa media mensile in prodotti diversa.
Che tipi di analisi statistiche posso condurre, considerando che la numerosità degli intervistati è diversa per le diverse provenienze dei dati?
Mi piacerebbe legare i criteri di preferenza alle altre variabili, ma anche rendere il più possibile "intelleggibili" i risultati.
Grazie in anticipo.
[xdom="hamming_burst"]Benvenuto, ho suddiviso gli argomenti essendo il post originale ancora in corso di discussione. La tua questione, anche se può essere simile, ha possibilità di creare confusione inutile.[/xdom]
Riassumo il mio caso.
Mi trovo a svolgere una indagine di mercato simulata (influenti per la scelta di un prodotto). Ho SEI opzioni diverse, ognuna delle quali è valutabile da 1 (influenza minima) a 7 (influenza massima). Non c'è vincolo nell'assegnare valutazioni, cioè posso dare anche tutti 1 o tutti 7, l'importante è che assegni ad ogni fattore un punteggio.
Gli intervistati hanno diverse provenienze (negozi di diverso tipo), diverse età, una spesa media mensile in prodotti diversa.
Che tipi di analisi statistiche posso condurre, considerando che la numerosità degli intervistati è diversa per le diverse provenienze dei dati?
Mi piacerebbe legare i criteri di preferenza alle altre variabili, ma anche rendere il più possibile "intelleggibili" i risultati.
Grazie in anticipo.
[xdom="hamming_burst"]Benvenuto, ho suddiviso gli argomenti essendo il post originale ancora in corso di discussione. La tua questione, anche se può essere simile, ha possibilità di creare confusione inutile.[/xdom]
Risposte
"tecnoworld":
Che tipi di analisi statistiche posso condurre, considerando che la numerosità degli intervistati è diversa per le diverse provenienze dei dati?
sono tutti campioni di numerosità >30?
sì, ma sono di numerosità comunque ampiamente eterogenea. Per esempio il campione più grande ha circa 240 dati, il più piccolo attorno ai 50. Nella peggiore delle ipotesi, per rendere più omogenea la numerosità, posso riunire campioni tra loro semanticamente più simili, ma l'ideale sarebbe mantenerli disgiunti.
nessun suggerimento?
p.s.: mi chiedevo: avrebbe senso, oltre a fare analisi sui valori direttamente immessi dagli intervistati, rendere tali valori relativi rispetto alla media dei loro totali?
mi spiego meglio. Poniamo che un intervistato risponda con la seguente stringa: [1;5;7;2;4;1] mentre un altro intervistato risponda con la seguente [5;5;5;5;5;5]. Se guardo le cose da un punto di vista puramente oggettivo, il primo mi ha dato un'informazione più variegata, ma ha usato un totale minore di punti (20) rispetto al secondo (30). Come devo trattare questa cosa? Un modo che mi è venuto in mente è calcolare la media del totale dei punteggi di ciascun rispondente (nell'esempio sarebbe 25) e poi dividere ciascun valore per il totale del loro vettore e moltiplicare il risultato per tale media.
Cioè avremmo, per il primo [1/20*25;5/20*25;....;1/20*25] e per il secondo [5/30*25;5/30*25;...;5/30*25], cosa che mi renderebbe più confrontabili le risposte. Cosa ne pensate?
p.s.: mi chiedevo: avrebbe senso, oltre a fare analisi sui valori direttamente immessi dagli intervistati, rendere tali valori relativi rispetto alla media dei loro totali?
mi spiego meglio. Poniamo che un intervistato risponda con la seguente stringa: [1;5;7;2;4;1] mentre un altro intervistato risponda con la seguente [5;5;5;5;5;5]. Se guardo le cose da un punto di vista puramente oggettivo, il primo mi ha dato un'informazione più variegata, ma ha usato un totale minore di punti (20) rispetto al secondo (30). Come devo trattare questa cosa? Un modo che mi è venuto in mente è calcolare la media del totale dei punteggi di ciascun rispondente (nell'esempio sarebbe 25) e poi dividere ciascun valore per il totale del loro vettore e moltiplicare il risultato per tale media.
Cioè avremmo, per il primo [1/20*25;5/20*25;....;1/20*25] e per il secondo [5/30*25;5/30*25;...;5/30*25], cosa che mi renderebbe più confrontabili le risposte. Cosa ne pensate?