ANOVA, gradi di libertà residui

bartofra
Ciao a tutti sono alle prese con il seguemte esercizio:

In uno studio sociologico si vuole indagare l’influenza della famiglia di origine sulla
predisposizione all’abbandono scolastico; vengono dunque analizzati il numero di
abbandoni della scuola secondaria superiore, in termini di numero di casi su 10000
iscritti, in 60 strutture scolastiche statunitensi tra il 1984 e il 2000. Gli abbandoni
vengono suddivisi in 6 gruppi in base al livello sociale della famiglia di origine
(tenendo conto del livello di istruzione dei genitori e del reddito annuo pro-capite).
L’output dell’analisi è mostrato nell’allegato I; si completi l’output e si commentino
i risultati: è possibile affermare che la famiglia di origine ha influenza sull’abbandono
scolastico?


Viene quindi fornita come allegato la seguente tabella parziale:


---------------- Df-------------------Sum Sq----- Mean Sq-------Fvalue-------Pr(>F)

gruppo------------5------------------ 225393 ---------?----------------?-----------5.323 e-09

residuals----------?------------------167893-----------?

che costituisce l'output di un programma di statistica . I punti interrogativi sono i punti da trovare.


Dalle formule ho: $ F0=(MS tratt.) / (MSe) $

Dove MS tratt. è la media quadratica dei trattamenti.

Considero 6 trattamenti e 60 osservazioni. a= 6 n = 60. Il grado di libertà dei trattamenti = a-1 = 5
Quindi MS tratt. = Mean Sq = Sum Sq / a-1 = 45078,6 che corrisponde al risultato fornito.

Quello che non capisco, è perchè i gradi di libertà dei residui debbano valere 54 .

a me viene $ a*(n -1) = 354$ e quindi $ MSe = (SSe)/354 =474$ Ma la risposta esatta pare sia $3109$



Anche considerando $60$ blocchi si avrebbe $MSe = (SSe)/((a-1)(b-1)) = 569 $ Il risultato sarebbe falso.

Da dove viene quindi questo $Df = 54$ dei residui?


:?:

Risposte
bartofra
Grazie, faccio fatica a ragionare sui gradi di libertà. Intuisco di cosa si parla ma non ne ho trovato una definizione sui libri. E mi sembra che assumi un significato diverso a seconda dei contesti.

Non capisco cosa intendi quando dici:

[1] Vi sono infatti $n$ scarti dalla media generale, ma questi non sono indipendenti in quanto la loro somma deve essere nulla, quindi conoscendo $n-1$ scarti l' $n$-esimo risulta univocamente determinato.

e neanche:

[2] Vi sono infatti $t$ medie di trattamento, che però non sono indipendenti perché la somma dei loro scarti dalla media generale deve essere nulla.

Inoltre sull'edizione italiana di " Statistica per l'ingegneria" di Montgomery Runger Hubele è
scritto, a pagina 275 . Capitolo sull' ANOVA:
$SStra$ gradi di libertà = $a-1$
$SSE$ gradi di libertà = $a(n-1)$


dove $a$ sono i trattamenti e $n$ sono le osservazioni.

bartofra
Ora mi è piu chiaro ma,

Devo però riportare qui il testo dell'esercizio ( e scusa se insisto sull'argomento)

In uno studio sociologico si vuole indagare l’influenza della famiglia di origine sulla
predisposizione all’abbandono scolastico; vengono dunque analizzati il numero di
abbandoni della scuola secondaria superiore, in termini di numero di casi su 10000
iscritti, in 60 strutture scolastiche statunitensi tra il 1984 e il 2000. Gli abbandoni
vengono suddivisi in 6 gruppi in base al livello sociale della famiglia di origine
(tenendo conto del livello di istruzione dei genitori e del reddito annuo pro-capite).
L’output dell’analisi è mostrato nell’allegato I; si completi l’output e si commentino
i risultati: è possibile affermare che la famiglia di origine ha influenza sull’abbandono
scolastico?


Ho pensato che $n = 60$ sono il numero di osservazioni per ogni trattamento

$a = 6$ numero di osservazioni.

$a*(n-1) = 354$ $MSe $ gradi di libertà.

Ma il testo dice che sono $54$ e sicuramente qualcosa mi è sfuggito

:(

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.