Lancio di 2 dadi e giudizio sulla "bontà"

ross.dream
Salve, sono alle prese con un esercizio relativo al lancio di due dadi e al calcolo del chi-quadro. Ecco la traccia (al posto di valori numerici vi sono lettere poiché ci vengono forniti dei "modelli" di esercizi da svolgere): Si ipotizzi di aver effettuato X lanci di due dadi e di aver ottenuto: Y volte il risultato A, Z volte il risultato B, T volte il risultato C, S volte quello D, P volte i risultati E ed F ed infine Q volte i restanti. Si calcoli il chi-quadro e si dia un giudizio sulla bontà dei dadi. Premetto che l'argomento è trattato in maniera assurda sia nelle dispense che nel libro di testo (fra l'altro scritto proprio dal prof), e che durante le lezioni non è stato minimamente nominato. Ho studiato tutto da altri libri, ma fra gli esercizi svolti vi erano solo quelli relativi al lancio di un solo dado, mentre per il lancio di due dadi non so assolutamente come applicare la formula. In altre parole: nel calcolo della frequenza attesa, n x pi, con pi probabilità i-esima classe, come definisco le classi? Avendo le probabilità teoriche del lancio di due dadi (riportate in una tabella sul libro di testo), avrei pensato di raggruppare i vari risultati, somma delle facce dei due dadi, in k classi in base appunto a tali probabilità (ad esempio: lanciando due dadi, ho 1/36 di probabilità che abbia il risultato 2 o il risultato 12, per cui 2 e 12 li raggrupperei in una classe di probabilità pi=1/36). Tuttavia, così facendo, non riuscirei a ritrovarmi con le frequenze misurate...
Potreste gentilmente aiutarmi a capire come applicare la formula?
Vi ringrazio di cuore! :-)

Risposte
mouse85
ciao, io onestamente questa legge nn l'ho studiata bene ma appena ho letto il testo mi è saltata in mente la legge multinomiale... magari si può fare qualcosa vero questa direzione... ma nn ne sono sicuro è solo una pensata che mi è venuta mentre leggevo...

ross.dream
Ciao! Sinceramente non lo so proprio...non ha proprio accennato alla legge multinomiale durante le sue lezioni, e a conferma di ciò non è neanche presente nel programma del corso. Mi viene il dubbio che debba applicare direttamente la formula, risultato per risultato, con le relative frequenze e probabilità...Ma non ne sono sicuro!

mouse85
io nn so aiutarti questa legge c'è nel programma la so un pò teoricamente ma nn l'ho mai applica e tanto meno si ho studiato sopra più di tanto...

ross.dream
Grazie infinite sia per la chiarissima risposta, sia per i riferimenti!!!:)

ingalex
Scusatemi dato che si tratta della stessa traccia con cui ho trovato difficoltà (traccia 19) , e penso si tratti dello stesso professore. Potreste gentilmente spiegarmi una cosa? Se per classi si intendono le differenti frequenze osservate che in questo caso sono 6 (y,z,t,s,p,q), nel calcolo del CHI-QUADRO dovrei avere 6 addendi.
Però se calcolo le frequenze attese (teoriche):
n(2)P(2)=(1/36)X
n(3)P(3)=(2/36)X
n(4)P(4)=(3/36)X
n(5)P(5)=(4/36)X
n(6)P(6)=(5/36)X
n(7)P(7)=(6/36)X
n(8)P(8)=(5/36)X
n(9)P(9)=(4/36)X
n(10)P(10)=(3/36)X
n(11)P(11)=(2/36)X
n(12)P(12)=(1/36)X
Queste frequenze sono differenti per i vari eventi (anche se sono a coppie uguali tranne che per un evento)
Quello che vorrei capire è per quanto riguarda le due classi costituite dagli eventi e,f,g,h,i,l,m che hanno rispettivamente frequenze misurate pari a p e q come vanno inserite nella sommatoria?
In questo esempio http://users.unimi.it/~camelot/Didattic ... adro_2.pdf raggruppo le frequenze teoriche relative a eventi di una stessa classe in un'unica frequenza. Nel nostro caso come bisognerebbe procedere?

ingalex
Io avevo pensato di inserire come frequenza teorica relativa a più eventi la somma delle frequenze singole.
per esempio per la classe identificata dagli eventi e ed f la frequenza teorica da inserire nella sommatoria dovrebbe essere (5/36)X +(6/36)X =(11/36)X

Inoltre siccome a fine esercizio è scritto di esprimere un giudizio sulla bontà dei dadi, vorrei capire con cosa va confrontato il CHI-QUADRO e in che modo.
Maggiore è il CHI-QUADRO è maggiore dovrebbe essere la possibilità che il dado sia truccato. Ma con cosa va confrontato? Maggiore rispetto a che cosa?

P.S.: ma come si fanno ad inserire le formule e i simboli in questo forum? Esiste un editor avanzato? oppure è riservato solo all'admin?

markowitz
Come sempre quando si deve fare inferenza si confronta il valore della statistica test (qui chi-quadro con k-1 gradi di libertà) con il valore critico scelto in base a livello di sigificatività che si vuole attribuire al test. In ogni caso consiglio di riferirsi sempre al p-valore (che è funzione del risultato della statistica test) perchè rappresenta una misura di probabilità, cioè l'informazione più chiara che si può sperare di avere in contesti di incertezza.
Segnalo che, se non erro, l'affidabilità della statistica chi-quadro e, spannometricamente, garantita solo se la numerosità campionaria moltiplicata per la probabilità dell'evento più improbabile è maggiore di 5.
Nel vostro caso N>180

ingalex
"markowitz":
Come sempre quando si deve fare inferenza si confronta il valore della statistica test (qui chi-quadro con k-1 gradi di libertà) con il valore critico scelto in base a livello di sigificatività che si vuole attribuire al test. In ogni caso consiglio di riferirsi sempre al p-valore (che è funzione del risultato della statistica test) perchè rappresenta una misura di probabilità, cioè l'informazione più chiara che si può sperare di avere in contesti di incertezza.
Segnalo che, se non erro, l'affidabilità della statistica chi-quadro e, spannometricamente, garantita solo se la numerosità campionaria moltiplicata per la probabilità dell'evento più improbabile è maggiore di 5.
Nel vostro caso N>180


Mi scusi, ma onestamente non sono riuscito a capire la sua spiegazione, forse perchè alcune cose non sono state trattate in questi termini dal professore o non sono state proprio citate.
Nell'esercizio non viene fatto riferimento ad un "valore critico" né ad un "livello di significatività". Quindi come dovrei regolarmi? Poi non ho capito da cosa deriva la relazione N>180 dato che il numero dei lanci del dado è X. L'evento più probabile qual'è un questo caso? Gli eventi con stessa frequenza vanno raggruppati e quindi la probabilità relativa a quella classe sarà pari alla somma delle probabilità?

Sulle dipense c'è scritto che "un criterio per verificare la bontà di approssimazione delle distribuzioni è quello di verificare che il CHI-QUADRO sui inferiore al numero k di classi, ma per meglio quantificare il risultato della prova conviene introdurre il concetto di grado di libertà v della distribuzione."
In questo caso dovrebbe essere v=k-1=5 solo che poi non spiega cosa farsene di v. Dice solo che nel caso di densità di probabilità attesa di tipo normale v=k-3.
Al variare dei gradi di libertà varia la probabilità che il CHI-QUADRO superi un certo valore. Queste probabilità sono tabulate. Ma comunque in sede di esame non viene fornita la tabella con i valori tabulati.

markowitz
Il punto è questo, non so con che criterio il professore organizzi il corso e non mi ero soffermato molto neppure nella lettura dei post precedenti, perché secondo me non era necessario. Mi spiego meglio:
il quesito era "date un giudizio sulla bontà dei dadi"
lei aveva chiesto "...con cosa va confrontato? maggiore rispetto a cosa?"
Il quesito iniziale è un problema di statistica inferenziale e, a prescindere dal contesto, ci si deve ricondurre ad una “statistica test” che nel caso in esame è il test chi-quadro. Adesso "dare un giudizio" significa fare inferenza e, non so come proceda il libro di riferimento, ma è chiaro che, come sempre in questi casi, ci si deve ricondurre alla "verifica d'ipotesi".
Il punto è che, almeno qualitativamente, il concetto di verifica d'ipotesi deve essere conosciuto altrimenti non ha senso parlare d'inferenza statistica e farsi domande del tipo "diamo un giudizio..., verificare se…" perché sarebbe come tentare di istruire un processo senza avere la più pallida idea di cosa sia il diritto.
Nel mio intervento mi limitavo a riepilogare, in modo semplicistico, alcuni concetti chiave della verifica d’ipotesi. In precedenza lei diceva “maggiore è il valore del chi-quadro maggiore dovrebbe essere la probabilità che il dado sia truccato…” ed è corretto!, allora io ho cercato di riassumere la procedura da usare. Se poi i concetti di: ipotesi nulla e alternativa, statistica test, livello di significatività, confidenza statistica, errore di prima e seconda specie, p-valore,…sono del tutto nuovi allora davvero non capisco il metodo di lavoro dell’insegnante.
Forse, come lascia intendere l’ultimo messaggio che ha scritto, ci si riferisce a procedure meno formali, ma non ne ho mai sentito parlare e non posso esserle d’aiuto in tal senso.

Dopodiché il discorso N>180 che si potrebbe a questo punto evitare (supponevo 1/36 la prob. dell’evento meno probabile), si riferiva solo al fatto che per far si che il test sia affidabile N deve essere abbastanza grande. Se poi non diamo un valore numerico ad N ma diciamo che vale X allora il risultato del test sarà funzione di tale valore. E le frequenze empiriche? Se anche queste sono letterali possiamo solamente scrivere la statistica test in termini di formula generale ma non ricaviamo un valore numerico ed allora che senso ha chiedere opinioni sulla bontà dei dadi? Si possono solamente risegnalare le procedure di inferenza… senza avere un verdetto.

Infine se, invece di essere d’aiuto e/o chiarimento, il mio intervento ha generato confusione può benissimo ignorarlo e preparare l’esame con le modalità indicate dal prof.

ingalex
"markowitz":
Il punto è questo, non so con che criterio il professore organizzi il corso e non mi ero soffermato molto neppure nella lettura dei post precedenti, perché secondo me non era necessario. Mi spiego meglio:
il quesito era "date un giudizio sulla bontà dei dadi"
lei aveva chiesto "...con cosa va confrontato? maggiore rispetto a cosa?"
Il quesito iniziale è un problema di statistica inferenziale e, a prescindere dal contesto, ci si deve ricondurre ad una “statistica test” che nel caso in esame è il test chi-quadro. Adesso "dare un giudizio" significa fare inferenza e, non so come proceda il libro di riferimento, ma è chiaro che, come sempre in questi casi, ci si deve ricondurre alla "verifica d'ipotesi".
Il punto è che, almeno qualitativamente, il concetto di verifica d'ipotesi deve essere conosciuto altrimenti non ha senso parlare d'inferenza statistica e farsi domande del tipo "diamo un giudizio..., verificare se…" perché sarebbe come tentare di istruire un processo senza avere la più pallida idea di cosa sia il diritto.
Nel mio intervento mi limitavo a riepilogare, in modo semplicistico, alcuni concetti chiave della verifica d’ipotesi. In precedenza lei diceva “maggiore è il valore del chi-quadro maggiore dovrebbe essere la probabilità che il dado sia truccato…” ed è corretto!, allora io ho cercato di riassumere la procedura da usare. Se poi i concetti di: ipotesi nulla e alternativa, statistica test, livello di significatività, confidenza statistica, errore di prima e seconda specie, p-valore,…sono del tutto nuovi allora davvero non capisco il metodo di lavoro dell’insegnante.
Forse, come lascia intendere l’ultimo messaggio che ha scritto, ci si riferisce a procedure meno formali, ma non ne ho mai sentito parlare e non posso esserle d’aiuto in tal senso.

Dopodiché il discorso N>180 che si potrebbe a questo punto evitare (supponevo 1/36 la prob. dell’evento meno probabile), si riferiva solo al fatto che per far si che il test sia affidabile N deve essere abbastanza grande. Se poi non diamo un valore numerico ad N ma diciamo che vale X allora il risultato del test sarà funzione di tale valore. E le frequenze empiriche? Se anche queste sono letterali possiamo solamente scrivere la statistica test in termini di formula generale ma non ricaviamo un valore numerico ed allora che senso ha chiedere opinioni sulla bontà dei dadi? Si possono solamente risegnalare le procedure di inferenza… senza avere un verdetto.

Infine se, invece di essere d’aiuto e/o chiarimento, il mio intervento ha generato confusione può benissimo ignorarlo e preparare l’esame con le modalità indicate dal prof.


Il fatto che sia tutto espresso in forma letterale è dovuto al fatto che si tratti solo di modelli di tracce. Nelle tracce vere e proprie le lettere sono sostituite da dei numeri. Infatti volevo cercare di capire come procedere. Non ho capito se per le classi costituite da più eventi con stessa frequenza devo considerare la probabilità come somma delle probabilità dei singoli eventi. E inoltre non ho capito con i dati forniti dal professore come posso esprimere un giudizio sulla bontà dei dati. Perchè non sono riuscito a capire con cosa confrontare il valore di CHI-QUADRO ottenuto.
L'esercizio in questione è relativo ad un corso di misure e strumentazioni elettroniche. E putroppo sulle dispense questo argomento è trattato in maniera per niente esaustiva e troppo approssivativa. Per non parlare di come è stato trattato a lezione. Però evidentemente dato che in sede d'esame non si hanno a disposizione le tabelle con le probabilità al variare dei gradi di livertà e del valore assunto dal CHI-QUADRO, penso che il tipo di confronto da effettuare sia più grossolano. Il problema è capire quale sia.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.