Chiarimento sul test del chi quadro

lotuno
Buon pomeriggio, oggi stavo svolgendo un esercizio che mi chiede di verificare l'ipotesi nulla di distribuzione normale di una serie di dati sperimentali: ho svolto tutti i calcoli in un apposito foglio elettronico, ma andando a confrontare con la soluzione proposta mi sono accorto che l'estremo superiore, ovvero il chi quadro teorico massimo, è diverso. Per il resto combacia tutto, quindi mi chiedevo il perché: forse che il valore massimo deve essere diviso per qualche parametro, e non essere preso così come viene "sfornato dalla tabella"? Vi ringrazio anticipatamente per l'aiuto :smt023

Allego traccia + soluzione, e anche il mio svolgimento:

SVOLGIMENTO:


SOLUZIONE + TRACCIA:


NB: il valore da me trovato dell'estremo superiore è, nello specifico, $15,5073130558655$, invece quello proposto nella soluzione è $6,18829615584052$, e ho notato che il loro rapporto è circa $2,5$, che, con una fantasiosa associazione, è la metà del rischio di errore (appunto $5$) imposto dal problema. Può esserci qualche collegamento, oppure è semplicemente sbagliata la soluzione? Grazie ancora! :D

Risposte
Lo_zio_Tom
avete sbagliato entrambi...secondo me. Nel "chi-square goodness of fit test" il chi quadro teorico è soltanto il valore superiore che, con un valore del 90% corrisponde a circa 13,4 come si vede bene nella tabella seguente



Il test in questione è spiegato molto bene QUI

ad ogni modo nulla cambia, dato il basso valore del $chi^2$ sperimentale

leggendo la soluzione ho notato anche un altro errore grossolano...anche nella soluzione che ti hanno proposto: Il test del chi quadro non è molto preciso se vi sono poche osservazioni: occorrono almeno 4/ 5 osservazioni per ogni intervallo. Di conseguenza, i primi 3 intervalli e gli ultimi 3 andrebbero accorpati per ottenere un test più preciso. In questo modo di gradi di libertà scenderebbero a 4, il $chi_(90%)^2=7,78$ e andrebbe ricalcolato anche il valore sperimentale.

Nel link che ti ho messo è tutto spiegato per bene e c'è proprio un esempio con un intervallo con 2 osservazioni che poi accorpa nell'intervallo precedente. Nelle pagine successive trovi anche il test di Kolmogorov Smirnov, sempre come fit test...

quindi secondo me il modo più corretto di procedere è il seguente:

(ho preso per buoni i conti sulla media campionaria e dev standard, dato che provando a calcolarle ottenevo risultati leggermente diversi, probabilmente a causa di arrotondamenti)



a questo punto i gradi di libertà sono diventati $7-1-2=4$ e il valore critico (che si legge sulle tavole ) è il seguente:

$chi_((4).90%)^2=7,78$

ed ovviamente accettiamo l'ipotesi di normalità dei dati.

parlane con il prof e vedi che ti dice....il fatto che non si possa usare il test chi quadro con poche osservazioni è un dato consolidato...

ciao

lotuno
Va bene, darò un'occhiata! Grazie mille :D

lotuno
Ho capito, allora sicuramente leggerò il link che mi hai mandato così da avere un (chi) quadro più chiaro della situazione, grazie ancora :D

lotuno
Va bene, proverò a parlarne con il prof anche se a dir la verità sono sotto esame, e tra qualche giorno dovrei proprio andare a dare "Statistica e Misure meccaniche sperimentali" quindi non so se ce la faccio a fissare un incontro... Il fatto è che per gli esercizi abbiamo sempre utilizzato dei fogli di calcolo che ci ha dato il prof stesso, quindi abbiamo imparato a ragionare solo con quel tipo di metodo già pre-impostato, per questo sono rimasto sorpreso nel vedere che il risultato era diverso (ho fatto tutti i calcoli come si deve, ne sono convinto... o meglio, ne ero)

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.