Dubbio intervalli di confidenza
Buonasera, ho qui un esercizio che mi ha fatto sorgere un dubbio, parto dal testo.
In seguito ad un controllo medico in una scuola elementare durante un’epidemia di morbillo, 9 bambini su 75 risultano aver contratto il virus. Detta $ p $ la probabilità che un bambino della stessa scuola sia malato, determinare:
a) un intervallo di confidenza per $ p $ di livello 0.9 del tipo (0,a).
Dunque, innanzitutto un dubbio concettuale: avendo una $ p $ e basta, sarei tentato di trattarla da distribuzione di Bernoulli, ma siccome ho anche un 75 che potrei considerare come $ n $ e dunque ricorrere alla binomiale, come faccio a distinguere?
Detto ciò, io l'ho trattata da bernoulliana e mi sono ricavato la stima puntuale $ p' = 9/75 = 0,12 $, che sono gli unici dati che ho per ricavare una probabilità. A questo punto, l'intervallo di confidenza:
$ IC(0,9) -> 1-alpha= 0,9 ->alpha=0,1 $
Siccome vogliamo un intervallo unilatero sinistro (mi pare?) $ alpha $ non viene diviso per due nella ricerca sulle tavole, e dunque il percentile da cercare è del 90%, ossia 1,28. Infine si ha:
$ a = p' + Z(0,9)*sqrt(sigma^2/n) = 0,12+1,28*sqrt((0,12*0,88)/75) = 0,168 $
A questo punto, reitero la domanda di cui sopra: sicome il 75 iniziale è il mio $ n $... perchè non binomiale?
Grazie in anticipo
In seguito ad un controllo medico in una scuola elementare durante un’epidemia di morbillo, 9 bambini su 75 risultano aver contratto il virus. Detta $ p $ la probabilità che un bambino della stessa scuola sia malato, determinare:
a) un intervallo di confidenza per $ p $ di livello 0.9 del tipo (0,a).
Dunque, innanzitutto un dubbio concettuale: avendo una $ p $ e basta, sarei tentato di trattarla da distribuzione di Bernoulli, ma siccome ho anche un 75 che potrei considerare come $ n $ e dunque ricorrere alla binomiale, come faccio a distinguere?
Detto ciò, io l'ho trattata da bernoulliana e mi sono ricavato la stima puntuale $ p' = 9/75 = 0,12 $, che sono gli unici dati che ho per ricavare una probabilità. A questo punto, l'intervallo di confidenza:
$ IC(0,9) -> 1-alpha= 0,9 ->alpha=0,1 $
Siccome vogliamo un intervallo unilatero sinistro (mi pare?) $ alpha $ non viene diviso per due nella ricerca sulle tavole, e dunque il percentile da cercare è del 90%, ossia 1,28. Infine si ha:
$ a = p' + Z(0,9)*sqrt(sigma^2/n) = 0,12+1,28*sqrt((0,12*0,88)/75) = 0,168 $
A questo punto, reitero la domanda di cui sopra: sicome il 75 iniziale è il mio $ n $... perchè non binomiale?
Grazie in anticipo
Risposte
"Silence":
A questo punto, reitero la domanda di cui sopra: sicome il 75 iniziale è il mio $ n $... perchè non binomiale?
E perché no? Intanto ti ricordo che partendo da una bernulliana ed utilizzando come stimatore sufficiente per il parametro $p$ la somma delle x, ottieni proprio una binomiale, che è ciò che hai fatto tu, inconsciamente, ma hai proprio utilizzato una binomiale, dato che hai usato come statistica test una funzione della somma delle $X_i$ bernulliane.
Perché 75? perché l'intervallo di confidenza che hai calcolato tu non è un intervallo esatto...ma un intervallo approssimato (molto approssimato). Senza volerlo infatti utilizzi una distribuzione asintotica del parametro $hat(theta)$ che si distribuisce così
[size=150]$hat(theta)~N(theta;k(theta))$[/size]
dove $k(theta)$ è il membro di destra della disuguaglianza di Cramér Rao
ma non solo....anche così facendo l'intervallo di confidenza sarebbe più complesso da calcolare
Occorrerebbe infatti (nel caso più generale bilatero) risolvere la seguente disuguaglianza rispetto a $p$
$-z_(alpha/2)sqrt((p(1-p))/n)
da cui, dopo alcuni passaggi algebrici, trovi
Per arrivare al tuo intervallo (che è un'approssimazione dell'approssimazione) approssimi anche la varianza $p(1-p)$ con $hat(p)(1-hat(p))$ e così trovi l'intervallo che hai calcolato.
Tutta questa manfrina può essere fatta con la giustificazione che la tua binomilale (somma di bernulliane indipendenti) si può approssimare ad una Gaussiana, ma ciò vale solo per n grande, anzi vale quando $np>=5$
spero di essere stato abbastanza chiaro perché l'argomento, molte volte sottovalutato, non è affatto semplice
da cui, dopo alcuni passaggi algebrici, trovi
$[(hat(p)+z_(alpha/2)^2/(2n))/(1+z_(alpha/2)^2/n)-(z_(alpha/2)sqrt((z_(alpha/2)/(2n))^2+(hat(p)(1-hat(p)))/n))/(1+z_(alpha/2)^2/n);(hat(p)+z_(alpha/2)^2/(2n))/(1+z_(alpha/2)^2/n)+(z_(alpha/2)sqrt((z_(alpha/2)/(2n))^2+(hat(p)(1-hat(p)))/n))/(1+z_(alpha/2)^2/n)]$
Per arrivare al tuo intervallo (che è un'approssimazione dell'approssimazione) approssimi anche la varianza $p(1-p)$ con $hat(p)(1-hat(p))$ e così trovi l'intervallo che hai calcolato.
Tutta questa manfrina può essere fatta con la giustificazione che la tua binomilale (somma di bernulliane indipendenti) si può approssimare ad una Gaussiana, ma ciò vale solo per n grande, anzi vale quando $np>=5$
spero di essere stato abbastanza chiaro perché l'argomento, molte volte sottovalutato, non è affatto semplice
Dunque in effetti io avrei potuto trattarla in entrambi i modi, anche se chiaramente uno conviene decisamente più dell'altro... a questo punto però vorrei chiederti: e se io l'avessi trattata effettivamente da binomiale, dunque $ Bi(75, 9/75) $, e avessi fatto il calcolo dell'intervallo usando la varianza di una binomiale, dunque non più $ p'(1-p') $, ma $ np'(1-p') $, ovviamente il risultato cambia, ma l'errore dov'è?
Ho come la sensazione che la domanda sia sciocca, ma vorrei capire, nel momento in cui leggo il mio problema, come risolvermi la faccenda con "oh, qui bernoulli è meglio della binomiale, mi evito 4 giorni di conti", visto che alla fine sono entrambe opzioni viabili.
Grazie mille!
Ho come la sensazione che la domanda sia sciocca, ma vorrei capire, nel momento in cui leggo il mio problema, come risolvermi la faccenda con "oh, qui bernoulli è meglio della binomiale, mi evito 4 giorni di conti", visto che alla fine sono entrambe opzioni viabili.
Grazie mille!
Ti consiglio una buona lettura sulla ricerca di intervalli di confidenza, su un testo dove si spieghi il meccanismo di ricerca degli intervalli (es: metodo quantità pivotale, metodo statistico e metodo della trasformazione integrale).
Il tuo problema è che devi stimare il parametro p di una bernulli. Punto. Non è vero che devi stimare il parametro di una binomiale.
Usi la binomiale perché, per stimare il parametro p della bernulli hai a disposizione un campione casuale $X_1,...,X_n$ che genera una statistica sufficiente $T=SigmaX$ che è la miglior stima del parametro p.
per calcolare l'intervallo di confidenza devi sapere come si distribuisce T....e T si distribuisce come una binomiale.
più di così non so come altro spiegarlo
Il tuo problema è che devi stimare il parametro p di una bernulli. Punto. Non è vero che devi stimare il parametro di una binomiale.
Usi la binomiale perché, per stimare il parametro p della bernulli hai a disposizione un campione casuale $X_1,...,X_n$ che genera una statistica sufficiente $T=SigmaX$ che è la miglior stima del parametro p.
per calcolare l'intervallo di confidenza devi sapere come si distribuisce T....e T si distribuisce come una binomiale.
più di così non so come altro spiegarlo
Sei stato chiarissimo, il mio era semplicemente un dubbio d'indecisione, grazie infinite.
Ciao! Sono il tuo Tutor AI, il compagno ideale per uno studio interattivo. Utilizzo il metodo maieutico per affinare il tuo ragionamento e la comprensione. Insieme possiamo:
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Il Tutor AI di Skuola.net usa un modello AI di Chat GPT.
Per termini, condizioni e privacy, visita la relativa pagina.
Per termini, condizioni e privacy, visita la relativa pagina.