Frequenze e indice chi-quadro

konrad83
Viene condotta una indagine tra gli studenti di una scuola per analizzare se vi sia relazione tra la loro abitudine al fumo e quella dei genitori. I dati raccolti relativi a 100 intervistati, sono riassunti nella seguente tabella doppia:

abitudine al fumo dei genitori lo studente fuma?
si no totale

nessuno 3 22 25
uno solo 8 34 42
entrambi 7 26 33
totale 18 82 100

calcolare la frequenza prevista corrispondente alla coppia "entrambi" e "si" qualora vi fosse indipendenza tra abitudine al fumo degli studenti e quella dei genitori
a) 7,5 b) 8 c)5,94 d)7

calcolare il valore dell'indice chi-quadro
a) 0,87 b)1,84 c)3,11 d) 0,55

mi sapete dare queste due soluzioni?

grazie

Risposte
olaxgabry
In generale, quando hai indipendenza tra due caratteri, in presenza di frequenze assolute ogni singolo valore che hai nella tabella a doppia entrata deve essere uguale al prodotto tra il corrispondente totale di riga e il corrispondente totale di colonna e tale risultato lo devi dividere per il numero totale di osservazioni. Per capirci: la tua tabella è la seguente

sì no tot.riga
nessuno 3 22 25
uno solo 8 34 42
entrambi 7 26 33

tot. colonna 18 82 100

In caso di indipendenza, la frequenza assoluta relativa alle modalità "entrambi" e "sì" dovrebbe essere

$n_{31}=(33*18)/100=5,94$

e non 7. Solitamente per le frequenze assolute doppie si usa il simbolo $n_{ij}$, per il totale di riga il simbolo $n_{i.}$ e per quello di colonna $n_{.j}$: quindi in caso di indipendenza tra i caratteri dovresti avere $forall i,j$

$n_{ij}=1/(n)*(n_{i.}n_{.j})$

Bada che se hai le frequenze relative l'indipendenza è verificata se

$f_{ij}=f_{i.}*f_{.j}$

Per il secondo punto devi utilizzare la formula del chi-quadro di Person, senza nessuna correzione in quanto n=100: qui per correttezza va detto che alcuni optano per la correzione di Yates anche per $n=100$. Cmq se non hai fatto la correzione di Yates, procedi con la formula classica che dovresti avere.
Se non devi prendere la correzione di Yates, ti posto la formula da utilizzare: per comodità definisci

$c_{ij}=1/(n)*(n_{i.}n_{.j})$

La formula del chi-quadro di Person è

$sum_{i=1}^{h}sum_{j=1}^{k}(n_{ij}-c_{ij})^{2}/c_{ij}$

dove h è il numero totale di righe e k il numero totale di colonne. La formula è più facile di quello che sembri: prendi il primo elemento della tabella, ovvero

$n_{11}=3$

Sai che il totale di riga è 25, il totale di colonna è 18, per cui

$c_{11}=(25*18)/100=4,5$

Allora hai che

$(n_{11}-c_{11})^{2}=2.25$, per cui

$(n_{11}-c_{11})^{2}/c_{ij}=0.5$

Fallo per tutti gli elementi della tabella: alla fine somma i vari risultati e dovresto ottenere 0,87.
Ciao

konrad83
grazie tante sei stato/a molto chiaro/a... allora devo fare valore assoluto - valore relativo elevato al qadrato?fratto N ?

konrad83
ok ok capito ...grazie mille

olaxgabry
"konrad83":
grazie tante sei stato/a molto chiaro/a... allora devo fare valore assoluto - valore relativo elevato al qadrato?fratto N ?

Guarda attentamente quello che ho fatto: ho preso il valore assoluto $n_{ij}$, poi gli ho sottratto il valore $c_{ij}$ e ho elevato tutto al quadrato. Poi il risultato non l'ho diviso per n, ma per $c_{ij}$.
Ti rifaccio un esempio: prendi

$n_{12}=22$

Il totale di riga è 25, quello di colonna 82, per cui

$c_{12}=(82*25)/100=20,5$

Di conseguenza

$(n_{12}-c_{12})^2=2,25$

Quindi

$(n_{12}-c_{12})^{2}/c_{12}=0,1098$

Ragioni nel seguente modo per $n_{21}, n_{22}, n_{33}, n_{34}$: alla fine sommi tutti i risultati ed ottieni il valore che ti serve. Ad esempio devi sommare
$0,1098$ a $0,5$ (del post precedente), più gli altri che mancano. Se hai problemi te li posto tutti.
Ciao

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.