Stabilire se una distribuzione è uniforme

lotuno
Buongiorno, oggi sto provando a svolgere questo piccolo esercizio in cui mi si chiede se sia possibile dire che la distribuzione dei seguenti dati possa essere di tipo uniforme o meno, e di fare una verifica col metodo del chi quadro. I dati dovrebbero essere quelli che riporto sotto, però non so come organizzarli e come procedere alla verifica. So che il test del chi quadro esige di fissare un rischio di errore (per esempio io volevo fissarlo al 15%) e tramite le tabelle andare a calcolare gli estremi superiore e inferiore dell'intervallo di accettazione.
Il problema che ho qui è capire come calcolare il chi quadro della mia distribuzione: come mi conviene organizzare i dati? Su internet la variabile chi quadro è definita come la sommatoria per ogni evento del quadrato degli scarti tra frequenze teoriche e quelle osservate, pesato sulle frequenze teoriche stesse. Quindi dovrei organizzare i dati in tot range (per esempio: da 8,001 a 8,010) e poi farne le frequenze? Mi scuso per l'ignoranza che ho in materia, purtroppo è il primo esercizio di questo tipo e ho bisogno di una guida, di un input per sbloccarlo. Ringrazio tutti anticipatamente.

Nell'esempio dell'esercizio questi dati sono relativi a delle misure di un pezzo meccanico effettuate da 5 operatori:

Risposte
Lo_zio_Tom
ti consiglio di riportare per bene il testo, in tutte le sue parti SENZA TRALASCIARE NULLA....così scritto non si capisce nulla (cioè io non capisco nulla...magari altri sì). Il test del chi quadro può essere usato sia per accostamento che per indipendenza. In altri termini se le misure sono effettuate da un singolo operatore si può testare che la distribuzione delle 10 misure segua una uniforme...oppure si può testare ogni operatore abbia una distribuzione uniforme....oppure che le misure dei 5 operatori siano indipendenti....ecc ecc

Oltretutto per testare se la distribuzione è uniforme con il test del chi quadro occorre specificare totalmente la distribuzione...ovvero occorre sapere che uniforme sia.....altrimenti occorre stimare i parametri della distribuzione della popolazione con il metodo della massima verosimiglianza

ciao

lotuno
Ciao, ti ringrazio per la risposta celere: la traccia effettivamente non esiste, nel senso che questa tabella di dati è presa da un lucido usato dal prof a spiegazione (la didascalia completa dell'immagine, se ti può essere utile, è: "risultati, espressi in millimetri, delle misurazioni di lunghezza di un manufatto, fatte da 5 diversi operatori. Schema di controllo ad un solo fattore") e lui successivamente ci ha mandato una mail in cui diceva: "osservando la distribuzione dei dati usati per gli esempi dei lucidi si nota che un'ipotesi di distribuzione uniforme tra i valori massimo e minimo riscontrati potrebbe essere adeguata", quindi chiedeva a noi di provare a rigettare o meno questa ipotesi tramite un test di chi quadro.
Secondo te, alla luce di ciò, l'ipotesi su cosa è da fare? Si deve testare se ogni operatore abbia una distribuzione uniforme? Io appunto per quello avevo pensato di dividere tutto in intervalli e vedere se tutte le misure nel complesso potessero avere un andamento di tipo uniforme

Lo_zio_Tom
"lotuno":
"osservando la distribuzione dei dati usati per gli esempi dei lucidi si nota che un'ipotesi di distribuzione uniforme tra i valori massimo e minimo riscontrati potrebbe essere adeguata",


"lotuno":
"risultati, espressi in millimetri, delle misurazioni di lunghezza di un manufatto, fatte da 5 diversi operatori.


scritto così già si capisce meglio....dandoti minimo e massimo della distribuzione uniforme (che ti ricordo essere definta da $f(x)=1/(b-a)I_([a;b])(x)$) abbiamo tutta la distribuzione....per cui possiamo mettere insieme tutte le 50 osservazioni ed effetturare un test chi quadro di adattamento....avrei preferito un titolo con l'aggiunta "considerando le misure dei 5 operatori indipendenti"

Così come è scritto prima di procedere all'adattamento farei un test di indipendenza...ma va beh....lasciamo perdere

lotuno
Grazie, ma la variabile del chi quadro in questo caso come devo calcolarla? È qui che mi perdo, perché una volta fissato il rischio con le tabelle non dovrebbe essere difficile calcolare i limiti superiore e inferiore e confrontarli col chi quadro trovato.

Lo_zio_Tom
devi prendere le 50 osservazioni, dividerle in $k$ intervalli a scelta, dopodiché calcolare la statistica

$chi_(k-1)^2=sum_(i=1)^(k)(n_(i)-ntheta_(i))^2/(ntheta_(i))$

indicando con

$n_(i)$ il numero delle osservazioni campionarie che cadono nell'-i-esimo intervallo

$ntheta_(i)$ il numero delle frequenze teoriche dell'intervallo i

La regione critica da considerare è la seguente:

$P{chi_(k-1)^2>h}=alpha$

con $alpha$ fissato...in genere si usa $alpha=0,05$ oppure $alpha=0,01$...al 15% non esistono nemmeno le tavole tabulate....devi calcolarti la chi quadro a mano o con un calcolatore

i valori della $chi^2$ si leggono sulle apposite tavole

ecco il test (il primo intervallo è chiuso anche a sinistra, ovvimente)



$chi_(9,( 0,95))^2=16,919$

dato che $11,2<16,919$ accettiamo l'ipotesi di uniformità della distribuzione

****************************************************************************************************
Ps: se proprio volessimo essere "precisini" dovremmo dire che abbiamo "stimato" i parametri della distribuzione della popolazione con i dati campionari utilizzando il metodo della massima verosimiglianza che porterebbe a dire

$hat(a)=min(x_(i))$

$hat(b)=max(x_(i))$

per cui la statistica sarebbe


$chi_(k-2-1)^2=sum_(i=1)^(k)(n_(i)-nhat(theta)_(i))^2/(nhat(theta)_(i))$


...e quindi dato che la uniforme ha due parametri $a,b$ i gradi di libertà della chi quadro scenderebbero di 2 unità.....quindi il chi quadro teorico sarebbe $14,067$ al 95%....ma il test passerebbe lo stesso....il numero di k intervalli lo puoi scegliere tu a capocchia, tenendo presente però che il numero minimo di osservazioni teoriche non deve essere inferiore a 5 in ogni intervallo.

ciao

lotuno
Ti ringrazio per la risposta e la disponibilità, e ti chiedo solo un'ultima cosa: c'è un modo per calcolare la frequenza teorica con excel senza dover farlo a mano e con le tabelle?

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.