Test delle ipotesi con varianza non nota<p-value>
DATI
$\bar x=41.3$
$s=12.2$
$n=20$
$\alpha =0.05$
$H_0 : \mu>=50$
$H_1 : \mu<50$
Usando lo statistica test $t<-t_(19,0.05)$ decido di rifiutare l'ipotesi nulla il che pare corretto ,però vorrei provare ad arrivare allo stesso risultato attraverso il p-value ,è possibile? Potreste aiutarmi?
$\bar x=41.3$
$s=12.2$
$n=20$
$\alpha =0.05$
$H_0 : \mu>=50$
$H_1 : \mu<50$
Usando lo statistica test $t<-t_(19,0.05)$ decido di rifiutare l'ipotesi nulla il che pare corretto ,però vorrei provare ad arrivare allo stesso risultato attraverso il p-value ,è possibile? Potreste aiutarmi?
Risposte
basta che invece di guardare il quantile guardi il valore della probabiltà....quello è il p-value
PS: nell'esercizio non si specifica nulla circa la distribuzione.....ovviamente la distribuzione sorgente deve essere Gaussiana
il $t_(s t a t)=(41.3-50)/(12.2) sqrt(20)=-3.18$
al quantile $-3.18$ il pvalue è minore di 0.5%.....quindi rifiuti l'ipotesi praticamente a qualunque livello di significatività
facciamo un esempio diverso:
$bar(x)=46.3772$
a questo punto il quantile verrebbe
$t_(s t a t)=(46.3772-50)/(12.2) sqrt(20)=-1.328$
a cui corrisponde un p-value del 10% (sempre con 19gdl)
cioè rifiuti tutte le ipotesi con un livello di significatività inferiore
PS: nell'esercizio non si specifica nulla circa la distribuzione.....ovviamente la distribuzione sorgente deve essere Gaussiana
il $t_(s t a t)=(41.3-50)/(12.2) sqrt(20)=-3.18$
al quantile $-3.18$ il pvalue è minore di 0.5%.....quindi rifiuti l'ipotesi praticamente a qualunque livello di significatività
facciamo un esempio diverso:
$bar(x)=46.3772$
a questo punto il quantile verrebbe
$t_(s t a t)=(46.3772-50)/(12.2) sqrt(20)=-1.328$
a cui corrisponde un p-value del 10% (sempre con 19gdl)
cioè rifiuti tutte le ipotesi con un livello di significatività inferiore
Il mio testo suggerisce che quando la varianza non è nota di usare la distribuzione t di student
quindi
$p value =P(Z
(cross-posted)
quindi
$p value =P(Z
il tuo testo si dimentica di dire che la distirbuzione sorgente deve essere Gaussiana....se no pippa.....a meno che n non sia grande abbastanza da usare il TLC....ma a questo punto puoi anche evitare di usare la t di Student dato che puoi tranquillamente usare la Gaussiana.
comunque a parte ciò (che a te non interessa ma io lo devo specificare, altrimenti c'è sempre qualcuno che me lo fa notare...)
comunque penso di averti risposto in maniera esauriente....ti ho fatto anche un esempio...
comunque a parte ciò (che a te non interessa ma io lo devo specificare, altrimenti c'è sempre qualcuno che me lo fa notare...)
comunque penso di averti risposto in maniera esauriente....ti ho fatto anche un esempio...
"tommik":
...
al quantile $-3.18$ il pvalue è minore di 0.5%.....quindi rifiuti l'ipotesi praticamente a qualunque livello di significatività...
come fai a dirlo? hai fatto un calcolo? vorrei capire questo poichè non riesco a reperire questa informazione
il TLC penso non si possa usare in questo caso data la popolazione troppo piccola
"puppeteer":
come fai a dirlo? hai fatto un calcolo?
guardo le tavole....

il valore 3.18 è compreso fra 2.861 e 3.883 e quindi il pvalue sarà compreso fra 0.5% e 0.05%
Oppure con excel basta usare la formula tabulata per trovare il p-value esatto: $0.2465%$
a parte che con n=20 la popolazione non è affatto piccola...e se anche usassi la normale arriversti alle stesse conclusioni....comunque te lo dico per informazione....per usare la t di student la distribzione sorgente DEVE essere normale....ti sei mai chiesto perché si usa la t di Student..oppure pensi sia un dogma?
La t esce da una statistica che è una trasformazione di una Gaussiana....quindi....
in poche parole la t esce da questa trasformazione
$t=Z/sqrt(U/m)$
dove $Z$ è una normale std mentre $U$ è una $chi_((m))^2$ fra loro indipendenti
ora, nel modello normale (e soltanto lì) abbiamo che la media campionaria è normale e la varianza campionaria si riconduce ad una $chi^2$ indipendente dalla media campionaria......ma solo nel modello normale
**********************
oltre al metodo del quantile e quello del p-value esiste anche un terzo medodo

Ok ora è chiaro!!Sarei curioso di scoprire questo terzo modo
PS
il coefficiente m cosa è?
PS
il coefficiente m cosa è?
devi confrontare fra loro le statistiche campionarie....ovvero devi trovare la $bar(x)$ critica al di sotto (sopra) della quale rifiuti o accetti....in pratica in tutti e tre i metodi la formula è sempre la stessa, solo che vai a confrontare indicatori diversi.
Il terzo metodo è il più utile, mentre quello del p-value è il più omnicomprensivo e dice anche "di quanto" accetti o rifiuti
Ad esempio, leggendo un articolo, leggi che il p.value del test è risultato 8%...Sai che quel test rifiuta l'ipotesi per valori di significatività minori del 10% ma accetta ipotesi con livelli di significatività minori o uguali al 5%...quindi il test è poco significativo....
riprendendo il tuo esempio, la statistica test con $alpha=0.05$ e 19 gdl diventa:
$(bar(x)-50)/(12.2)sqrt(20)=-1.729$
da cui $bar(x)_(s t a t)=45.28$
quindi accetti l'ipotesi se la media campionaria è più alta di $45.28$
nel tuo caso la media campionaria è 41.3 e quindi rifiuti
Il terzo metodo è il più utile, mentre quello del p-value è il più omnicomprensivo e dice anche "di quanto" accetti o rifiuti
Ad esempio, leggendo un articolo, leggi che il p.value del test è risultato 8%...Sai che quel test rifiuta l'ipotesi per valori di significatività minori del 10% ma accetta ipotesi con livelli di significatività minori o uguali al 5%...quindi il test è poco significativo....
riprendendo il tuo esempio, la statistica test con $alpha=0.05$ e 19 gdl diventa:
$(bar(x)-50)/(12.2)sqrt(20)=-1.729$
da cui $bar(x)_(s t a t)=45.28$
quindi accetti l'ipotesi se la media campionaria è più alta di $45.28$
nel tuo caso la media campionaria è 41.3 e quindi rifiuti
Scusami ma perchè $-2.093$? dato $\alpha$ che hai detto non è -1.729?
"puppeteer":
il coefficiente m cosa è?
i gdl....i tuoi $(n-1)$ che usi così tanto....ma senza sapere da dove escono
"puppeteer":
Scusami ma perchè $-2.093$? dato $\alpha$ che hai detto non è -1.729?
sì è vero....ho letto male la tavola...vedo che sei attento

Perfetto ti ringrazio ancora e procedo a stamparmi la discussione

se vuoi ti dimostro perché si usa la t di student....ma servono alcuni teoremi....fra cui quello di Basu....forse però non lo avete nemmeno trattato.....

tutto qui...per il teorema di Basu la media campionaria e la varianza campionaria sono indipendenti (dato che uno è stimatore sufficiente e completo mentre l'altro è ancillare)...e quindi abbiamo trovato la definizione della t
MA SOLO SE IL MODELLO E' NORMALE, ALTRIMENTI IL TEOREMA DI BASU NON VALE PIU'...così come non vale più la seguente
$(n-1)S^2/sigma^2~chi_(n-1)^2$
quindi dì pure al docente di esser più preciso....altrimenti fate solo confusione

tutto qui...per il teorema di Basu la media campionaria e la varianza campionaria sono indipendenti (dato che uno è stimatore sufficiente e completo mentre l'altro è ancillare)...e quindi abbiamo trovato la definizione della t
MA SOLO SE IL MODELLO E' NORMALE, ALTRIMENTI IL TEOREMA DI BASU NON VALE PIU'...così come non vale più la seguente
$(n-1)S^2/sigma^2~chi_(n-1)^2$
quindi dì pure al docente di esser più preciso....altrimenti fate solo confusione
Purtroppo no, ma conto di studiarlo nel pomeriggio e domani apro una discussione per la t-student cosi da non andare off-topic,solo una cosa il teorema di Basu è anche detto di fattorizzazione?
In sostanza ci siamo riportati alla formula del post 6.Guarda una cosa che non sopporto della attuale didattica è che si tralasciano molte cose
,per caso conosci delle fonti esterne che riportano questa dimostrazione?
