Prova delle ipotesi su Gaussiana
Mi sembra di aver capito, anche se ho provato a fare un esercizio per consolidare ma non mi sembra per niente corretto.
il modello mi sembra geometrico quindi:
$\bar Xn = 826/17 = 48.59$ e $\hat p = 1/48.59 = 0.0205$
Ora devo sfruttare il secondo dato del problema per calcolare la varianza da usare nello Standard error ma non capisco come.
Potrei fare come prima e scrivere che $\V(hat p) = sqrt((1- hat p)/(p^2*n))= 11.7$
Concentrandosi nella verifica dell'ipotesi: in questo caso è bilaterale.
$\Z= (hat p - P_0)/sqrt((1 - P_0)/(P_0^2 * n)) $
e controllo se il valore è dentro il range -1.96, 1.96.
Non svolgo i calcoli perchè mi sembra che ci sia un errore nel calcolo della varianza.
Da indagini precedentemente svolte è noto che l'età media di insorgenza di disturbi cardiovascolari per le donne è 48 anni. Si considera un campione di 17 donne con disturbi cardiovascolari e si rileva l'età in cui gli stessi si sono manifestati. A partire dalla rilevazione campionaria x1;...; x17 si ricava che
$\sum_{k=1}^17 x_i = 826$ e $\sum_{k=1}^17 (x_i)^2=44063 $
Nell'ipotesi che i dati siano gaussiani, si introduca un opportuno stimatore per l'età media e si determini l'associato standard
error. Si forniscano i corrispondenti valori di stima. Inoltre, si verichi l'ipotesi H0 : $\mu$ = 48, a
fronte di un'alternativa bilaterale, considerando un livello di signicatività $\alpha$= 0.05.
il modello mi sembra geometrico quindi:
$\bar Xn = 826/17 = 48.59$ e $\hat p = 1/48.59 = 0.0205$
Ora devo sfruttare il secondo dato del problema per calcolare la varianza da usare nello Standard error ma non capisco come.
Potrei fare come prima e scrivere che $\V(hat p) = sqrt((1- hat p)/(p^2*n))= 11.7$
Concentrandosi nella verifica dell'ipotesi: in questo caso è bilaterale.
$\Z= (hat p - P_0)/sqrt((1 - P_0)/(P_0^2 * n)) $
e controllo se il valore è dentro il range -1.96, 1.96.
Non svolgo i calcoli perchè mi sembra che ci sia un errore nel calcolo della varianza.
Risposte
no, non va bene per niente. Stavolta però invece di mostrarti la soluzione ti invito a leggere bene la teoria.
Il punto principale del problema è una prova di ipotesi sulla media di una Gaussiana con varianza non nota. A differenza dell'altro problema, qui $n$ è piuttosto piccolo, 17, ma è nota la distribuzione della popolazione....
Visto il tipo di soluzione sembra che tu stia cercando di risolvere esercizi per tentativi, senza aver ben studiato la teoria....
Quindi ripassa il problema teorico poi ci risentiamo. Ovviamente per dubbi, spiegazioni o delucidazioni qualcuno che risponde c'è sempre....
PS: un topic ogni problema, grazie
Il punto principale del problema è una prova di ipotesi sulla media di una Gaussiana con varianza non nota. A differenza dell'altro problema, qui $n$ è piuttosto piccolo, 17, ma è nota la distribuzione della popolazione....
"iggy":
Nell'ipotesi che i dati siano gaussiani, si introduca ecc ecc
Visto il tipo di soluzione sembra che tu stia cercando di risolvere esercizi per tentativi, senza aver ben studiato la teoria....
Quindi ripassa il problema teorico poi ci risentiamo. Ovviamente per dubbi, spiegazioni o delucidazioni qualcuno che risponde c'è sempre....
PS: un topic ogni problema, grazie
Ok effettivamente mi ero portato più avanti rispetto a quello fatto in classe senza accorgermene.
Quindi in questo caso dovrei utilizzare la media campionaria studentizzata poichè la media è ignota; il procedimento mi è chiaro, ma non riesco a calcolare la somma campionaria (corretta) da inserire nella formula. Devo ricavarla dalla seconda sommatoria data dall'esercizio, ma non capisco come.
ps quando l'avrò calcolata metto il procedimento di risoluzione per completezza
Quindi in questo caso dovrei utilizzare la media campionaria studentizzata poichè la media è ignota; il procedimento mi è chiaro, ma non riesco a calcolare la somma campionaria (corretta) da inserire nella formula. Devo ricavarla dalla seconda sommatoria data dall'esercizio, ma non capisco come.
ps quando l'avrò calcolata metto il procedimento di risoluzione per completezza
"iggy":
Quindi in questo caso dovrei utilizzare la media campionaria studentizzata poichè la [strike]media[/strike] varianza è ignota; il procedimento mi è chiaro, ma non riesco a calcolare la [strike]somma[/strike] varianza campionaria (corretta) da inserire nella formula. Devo ricavarla dalla seconda sommatoria data dall'esercizio, ma non capisco come.
ps quando l'avrò calcolata metto il procedimento di risoluzione per completezza
Dunque ti serve la varianza campionaria $S^2=1/(n-1)Sigma_i(X_i-bar(X))^2$ che, con 3 semplici passaggi algebrici, diventa
$1/(n-1)[Sigma_iX_i^2-(Sigma_iX_i)^2/n]=245.57$
nulla vieterebbe però di usare la varianza campionaria non corretta, quella divisa per $n$. Basta accordare di conseguenza la formula della distribuzione ancillare da usare....la t di Student.
ci sono centinaia di esercizi già risolti qui sul forum.....dagli un'occhiata
ciao
Riprendo questo esercizio perché trovo risultati strani.
Le due sommatorie citate da consegna sono 826.03 e 44065.6 e non 826 e 44065.
Per non crearmi confusione aggiuntiva, segnerò come $S^2$ la varianza campionaria e $S_c^2$ la varianza campionaria corretta, anche se la maggior parte dei libri non usa questa notazione.
Stimatore, varianza camp e standard error:
$hat mu = 826.03/17 = 48.59$
$S^2 = 44065.6/17 - 48.59^2 = 231.1$ quindi $S_c^2 = 17/16 * S^2 = 245.55$
$se(hat mu) = sqrt(S_c^2/n) = 245.55/17 = 3.8$
Intervallo di confidenza:
(anche se non c'è nella consegna)
se $alpha = 0.05$ quindi $alpha/2 = 0.025$
utilizzo la formula per l'intervallo di confidenza sulla media di popolazione normale con varianza ignota:
$hat mu +- T_0.025 * sqrt(S_c^2/n) = 48.59 +- 2.12*3.8 = [40.53,56.65]$
Verifica di ipotesi:
$H_0 : mu = 48$ $H_1: mu != 48$
utilizzo la formula per la verifica di ipotesi su popolazione normale con varianza ignota:
$T=(hat mu - mu)/sqrt(S_c^2/n) = (48.59-48)/sqrt(245.54/17) = 0.15$ (risultato strano)
Poichè tale valore è compreso fra $[-T_0.025,T_0.025]$ (-2.12,2.12) allora accetto $H_0$
Se voglio calcolare il P-value: $alpha^(oss) = 2[1-0.15] = 1.7$
Se potete darmi un occhio, sperando di non aver fatto errori sullo standard error
Grazie.
Le due sommatorie citate da consegna sono 826.03 e 44065.6 e non 826 e 44065.
Per non crearmi confusione aggiuntiva, segnerò come $S^2$ la varianza campionaria e $S_c^2$ la varianza campionaria corretta, anche se la maggior parte dei libri non usa questa notazione.
Stimatore, varianza camp e standard error:
$hat mu = 826.03/17 = 48.59$
$S^2 = 44065.6/17 - 48.59^2 = 231.1$ quindi $S_c^2 = 17/16 * S^2 = 245.55$
$se(hat mu) = sqrt(S_c^2/n) = 245.55/17 = 3.8$
Intervallo di confidenza:
(anche se non c'è nella consegna)
se $alpha = 0.05$ quindi $alpha/2 = 0.025$
utilizzo la formula per l'intervallo di confidenza sulla media di popolazione normale con varianza ignota:
$hat mu +- T_0.025 * sqrt(S_c^2/n) = 48.59 +- 2.12*3.8 = [40.53,56.65]$
Verifica di ipotesi:
$H_0 : mu = 48$ $H_1: mu != 48$
utilizzo la formula per la verifica di ipotesi su popolazione normale con varianza ignota:
$T=(hat mu - mu)/sqrt(S_c^2/n) = (48.59-48)/sqrt(245.54/17) = 0.15$ (risultato strano)
Poichè tale valore è compreso fra $[-T_0.025,T_0.025]$ (-2.12,2.12) allora accetto $H_0$
Se voglio calcolare il P-value: $alpha^(oss) = 2[1-0.15] = 1.7$
Se potete darmi un occhio, sperando di non aver fatto errori sullo standard error

Grazie.
"iggy":
Le due sommatorie citate da consegna sono 826.03 e 44065.6 e non 826 e 44065.
veramente nel tuo post iniziale avevi scritto numeri ancora diversi... 826 e 44063
più tardi ci dò un'occhiata
EDIT: anzi va .... riguarda tu perché non posso mettermi a correggerti tutti gli errori di calcolo
$S_(c)^2=17/16xx231.106=245.55$ e non $254.54$
RI-EDIT: ho visto che è un refuso perché poi hai messo il valore esatto nel test.
Il valroe di $0.15$ non è affatto un valore strano....è un valore al centro della distribuzione e quindi NON RIFIUTI $mathcal(H_0)$
PS: non si dice "accetto" ma "non rifiuto" nel senso che non vi sono oggettive informazioni per poter rifiutare l'ipotesi di lavoro (è una sottigliezza ma ha la sua importanza)
Per il calcolo del p-value con una t di student non è possibile in generale....ci vuole il calcolatore, a meno che il valore trovato non sia proprio quello delle tavole.....ma è difficile che ciò accada. E' comunque un p-value altissimo....essendo il t vicino a zero.
Ho corretto, avevo sbagliato a trascrivere il risultato ma i conti li avevo fatti con il numero corretto. Ho ricontrollato e non mi sembra ci siano errori di calcolo.
Per quanto riguarda i dati di partenza, sono diversi perché sono proprio due esercizi diversi; o meglio è lo stesso testo scritto con dati di partenza diversi.
Per quanto riguarda i dati di partenza, sono diversi perché sono proprio due esercizi diversi; o meglio è lo stesso testo scritto con dati di partenza diversi.
"iggy":
Se voglio calcolare il P-value: $alpha^(oss) = 2[1-0.15] = 1.7$
.
Il p-value è una probabilità.....mica puoi fare così.....devi calcolare l'integrale della t.....con la Gaussiana usi le tavole con la t puoi usare solo un calcolatore.....qui viene circa l'88%
Ad esempio con Excel basta fare
$"DISTRIB.T(0.155;16;2)=87.9%$
Forse mi sono spiegato male: solitamente in questi esercizi mi viene chiesto il p-value approssimato. In base al fatto che sia uni o bivariata ho delle formule da utilizzare. In questo caso la formula è $alpha^(oss) = 2[1-|t^(oss)|]$ e controllo se è maggiore o minore di $alpha$ per vedere quanto sicuro posso essere di rifiutare o non rifiutare. Poi magari ho non capito io...
Hai capito male tu....
Nella formula che hai scritto non ci va $t^(oss)$ ma ci va il valore della funzione integrale calcolata in quel punto
$int_(-oo)^(|t^(oss)|)f(tau)d tau$ che ovviamente si legge sulle tavole.
....non è la stessa cosa!!
$alpha_("oss")$ è un'area... $t_("oss")$ è un punto di ascissa.....
Per utilizzare il metodo del p-value devi confrontare le aree.....mentre con la tecnica usuale confronti le ascisse
Sono due tecniche diverse ed equivalenti per ottenere il medesimo risultato.....ma non fare pericolose confusioni
Per decidere puoi confrontare
$alpha_("oss")$ con $alpha_(crit)$ fissato, es 5% e rifiuti se $alpha_("oss")$ è più piccolo di quello fissato
Oppure puoi confrontare $z_(oss)$ con $z_(crit)$ e rifiuti se $z_(oss)$ è più grande[nota]ho messo z in generale....sarà t con la t di student, ovviamente[/nota]....
Ma c'è anche una terza via.....calcolare il valore critico della statistica.....es la media campionaria critica e confrontare questo valore con la tua statistica test.
Fai un grafico con una gaussiana e vedrai che le cose stanno proprio così
**************************************************************
Facciamo un esempio didattico con una gaussiana
**************************************************************
Supponiamo di essere in una situazione di decisione bilaterale e che i valori di $z_(crit)$ cioè i valori di soglia siano $z=+-1.96$ quindi abbiamo un $alpha$ fissato del 5%
Facciamo il nostro Z-test ed otteniamo uno $Z_(oss)=1.5$. Ovviamente non rifiutiamo $H_0$ perché $-1.96<1.5<1.96$ ma possiamo anche ragionare con il metodo del p-value
Al valore di $z=1.5$ corrisponde un p-value bilaterale (basta usare le tavole) di $2(1-0.933)~~13.4%$
Essendo un p-value più alto del 5% fissato non possiamo rifiutare l'ipotesi nulla
Spero che ora sia più chiaro....ricorda che p-value sta per "probability-value"
Fammi sapere se hai capito perché questo concetto è di importanza fondamentale per tutti i test statistici che farai in futuro....
"iggy":
in questi esercizi mi viene chiesto il p-value approssimato. In base al fatto che sia uni o bilaterale ho delle formule da utilizzare. In questo caso la formula è $alpha^(oss) = 2[1-|t^(oss)|]$ .
Nella formula che hai scritto non ci va $t^(oss)$ ma ci va il valore della funzione integrale calcolata in quel punto
$int_(-oo)^(|t^(oss)|)f(tau)d tau$ che ovviamente si legge sulle tavole.
....non è la stessa cosa!!
$alpha_("oss")$ è un'area... $t_("oss")$ è un punto di ascissa.....
Per utilizzare il metodo del p-value devi confrontare le aree.....mentre con la tecnica usuale confronti le ascisse
Sono due tecniche diverse ed equivalenti per ottenere il medesimo risultato.....ma non fare pericolose confusioni
Per decidere puoi confrontare
$alpha_("oss")$ con $alpha_(crit)$ fissato, es 5% e rifiuti se $alpha_("oss")$ è più piccolo di quello fissato
Oppure puoi confrontare $z_(oss)$ con $z_(crit)$ e rifiuti se $z_(oss)$ è più grande[nota]ho messo z in generale....sarà t con la t di student, ovviamente[/nota]....
Ma c'è anche una terza via.....calcolare il valore critico della statistica.....es la media campionaria critica e confrontare questo valore con la tua statistica test.
Fai un grafico con una gaussiana e vedrai che le cose stanno proprio così
**************************************************************
Facciamo un esempio didattico con una gaussiana
**************************************************************
Supponiamo di essere in una situazione di decisione bilaterale e che i valori di $z_(crit)$ cioè i valori di soglia siano $z=+-1.96$ quindi abbiamo un $alpha$ fissato del 5%
Facciamo il nostro Z-test ed otteniamo uno $Z_(oss)=1.5$. Ovviamente non rifiutiamo $H_0$ perché $-1.96<1.5<1.96$ ma possiamo anche ragionare con il metodo del p-value
Al valore di $z=1.5$ corrisponde un p-value bilaterale (basta usare le tavole) di $2(1-0.933)~~13.4%$
Essendo un p-value più alto del 5% fissato non possiamo rifiutare l'ipotesi nulla
Spero che ora sia più chiaro....ricorda che p-value sta per "probability-value"
Fammi sapere se hai capito perché questo concetto è di importanza fondamentale per tutti i test statistici che farai in futuro....
Sì ho capito.
Ti lascio un esercizio che abbiamo fatto in classe:
$H_0 : mu = 25$ $H_1 : mu != 25$ con $alpha = 0.05$
Tralasciando i dati e facendo i calcoli $t = -1.38$ che è compreso in $[-2.262, 2.262]$ che sono i valori per $T_(alpha/2) = 0.025$ con 9 gradi di libertà, quindi $H_0$ non viene rifiutato.
A questo punto viene detto (e cito): il grado di conformità tra $H_0$ e i dati non è molto alto, dal momento che $alpha^(oss) = 2[1 - F_T (|-1.38|)] = 0.20$
EDIT: Ho letto la spiegazione che hai aggiunto e di fatto in classe abbiamo utilizzato questa terza via. Ho abbastanza capito il ragionamento che sta dietro. Grazie per la spiegazione, mi stai dando veramente una grossa mano!
ps aldilà di questo il resto ti sembra corretto?
Ti lascio un esercizio che abbiamo fatto in classe:
$H_0 : mu = 25$ $H_1 : mu != 25$ con $alpha = 0.05$
Tralasciando i dati e facendo i calcoli $t = -1.38$ che è compreso in $[-2.262, 2.262]$ che sono i valori per $T_(alpha/2) = 0.025$ con 9 gradi di libertà, quindi $H_0$ non viene rifiutato.
A questo punto viene detto (e cito): il grado di conformità tra $H_0$ e i dati non è molto alto, dal momento che $alpha^(oss) = 2[1 - F_T (|-1.38|)] = 0.20$
EDIT: Ho letto la spiegazione che hai aggiunto e di fatto in classe abbiamo utilizzato questa terza via. Ho abbastanza capito il ragionamento che sta dietro. Grazie per la spiegazione, mi stai dando veramente una grossa mano!
ps aldilà di questo il resto ti sembra corretto?
"iggy":
A questo punto viene detto (e cito): il grado di conformità tra $H_0$ e i dati non è molto alto, dal momento che $alpha^(oss) = 2[1 - F_T (|-1.38|)] = 0.20$
questo infatti è corretto e coincide con ciò che ti ho detto io precedentemente
"tommik":
Nella formula che hai scritto non ci va $t^(oss)$ ma ci va il valore della funzione integrale calcolata in quel punto
$int_(-oo)^(|t^(oss)|)f(tau)d tau$ che ovviamente si legge sulle tavole.
però quel valore del p-value lo puoi calcolare solo col calcolatore....
$"DISTRIB.T(1.38;9;2)=20.1%$
...aggiungo le cose man mano perché sto scrivendo nei ritagli di tempo dal lavoro.....il resto non ho controllato ma mi pare ok
Ps: abbastanza capito non basta.....devi soffermarti e capire bene tutto il ragionamento se no poi son guai....IMHO