Test delle ipotesi con varianza non nota<p-value>

Comeover
DATI
$\bar x=41.3$
$s=12.2$
$n=20$
$\alpha =0.05$

$H_0 : \mu>=50$
$H_1 : \mu<50$


Usando lo statistica test $t<-t_(19,0.05)$ decido di rifiutare l'ipotesi nulla il che pare corretto ,però vorrei provare ad arrivare allo stesso risultato attraverso il p-value ,è possibile? Potreste aiutarmi?

Risposte
Lo_zio_Tom
basta che invece di guardare il quantile guardi il valore della probabiltà....quello è il p-value

PS: nell'esercizio non si specifica nulla circa la distribuzione.....ovviamente la distribuzione sorgente deve essere Gaussiana

il $t_(s t a t)=(41.3-50)/(12.2) sqrt(20)=-3.18$

al quantile $-3.18$ il pvalue è minore di 0.5%.....quindi rifiuti l'ipotesi praticamente a qualunque livello di significatività

facciamo un esempio diverso:

$bar(x)=46.3772$

a questo punto il quantile verrebbe

$t_(s t a t)=(46.3772-50)/(12.2) sqrt(20)=-1.328$

a cui corrisponde un p-value del 10% (sempre con 19gdl)

cioè rifiuti tutte le ipotesi con un livello di significatività inferiore

Comeover
Il mio testo suggerisce che quando la varianza non è nota di usare la distribuzione t di student
quindi
$p value =P(Z (cross-posted)

Lo_zio_Tom
il tuo testo si dimentica di dire che la distirbuzione sorgente deve essere Gaussiana....se no pippa.....a meno che n non sia grande abbastanza da usare il TLC....ma a questo punto puoi anche evitare di usare la t di Student dato che puoi tranquillamente usare la Gaussiana.

comunque a parte ciò (che a te non interessa ma io lo devo specificare, altrimenti c'è sempre qualcuno che me lo fa notare...)

comunque penso di averti risposto in maniera esauriente....ti ho fatto anche un esempio...

Comeover
"tommik":

...
al quantile $-3.18$ il pvalue è minore di 0.5%.....quindi rifiuti l'ipotesi praticamente a qualunque livello di significatività...


come fai a dirlo? hai fatto un calcolo? vorrei capire questo poichè non riesco a reperire questa informazione

il TLC penso non si possa usare in questo caso data la popolazione troppo piccola

Lo_zio_Tom
"puppeteer":


come fai a dirlo? hai fatto un calcolo?



guardo le tavole....



il valore 3.18 è compreso fra 2.861 e 3.883 e quindi il pvalue sarà compreso fra 0.5% e 0.05%

Oppure con excel basta usare la formula tabulata per trovare il p-value esatto: $0.2465%$

a parte che con n=20 la popolazione non è affatto piccola...e se anche usassi la normale arriversti alle stesse conclusioni....comunque te lo dico per informazione....per usare la t di student la distribzione sorgente DEVE essere normale....ti sei mai chiesto perché si usa la t di Student..oppure pensi sia un dogma?

La t esce da una statistica che è una trasformazione di una Gaussiana....quindi....

in poche parole la t esce da questa trasformazione

$t=Z/sqrt(U/m)$

dove $Z$ è una normale std mentre $U$ è una $chi_((m))^2$ fra loro indipendenti

ora, nel modello normale (e soltanto lì) abbiamo che la media campionaria è normale e la varianza campionaria si riconduce ad una $chi^2$ indipendente dalla media campionaria......ma solo nel modello normale

**********************

oltre al metodo del quantile e quello del p-value esiste anche un terzo medodo :snakeman:

Comeover
Ok ora è chiaro!!Sarei curioso di scoprire questo terzo modo
PS
il coefficiente m cosa è?

Lo_zio_Tom
devi confrontare fra loro le statistiche campionarie....ovvero devi trovare la $bar(x)$ critica al di sotto (sopra) della quale rifiuti o accetti....in pratica in tutti e tre i metodi la formula è sempre la stessa, solo che vai a confrontare indicatori diversi.

Il terzo metodo è il più utile, mentre quello del p-value è il più omnicomprensivo e dice anche "di quanto" accetti o rifiuti

Ad esempio, leggendo un articolo, leggi che il p.value del test è risultato 8%...Sai che quel test rifiuta l'ipotesi per valori di significatività minori del 10% ma accetta ipotesi con livelli di significatività minori o uguali al 5%...quindi il test è poco significativo....

riprendendo il tuo esempio, la statistica test con $alpha=0.05$ e 19 gdl diventa:

$(bar(x)-50)/(12.2)sqrt(20)=-1.729$

da cui $bar(x)_(s t a t)=45.28$

quindi accetti l'ipotesi se la media campionaria è più alta di $45.28$

nel tuo caso la media campionaria è 41.3 e quindi rifiuti

Comeover
Scusami ma perchè $-2.093$? dato $\alpha$ che hai detto non è -1.729?

Lo_zio_Tom
"puppeteer":

il coefficiente m cosa è?


i gdl....i tuoi $(n-1)$ che usi così tanto....ma senza sapere da dove escono

Lo_zio_Tom
"puppeteer":
Scusami ma perchè $-2.093$? dato $\alpha$ che hai detto non è -1.729?



sì è vero....ho letto male la tavola...vedo che sei attento :D

Comeover
Perfetto ti ringrazio ancora e procedo a stamparmi la discussione :D

Lo_zio_Tom
se vuoi ti dimostro perché si usa la t di student....ma servono alcuni teoremi....fra cui quello di Basu....forse però non lo avete nemmeno trattato.....



tutto qui...per il teorema di Basu la media campionaria e la varianza campionaria sono indipendenti (dato che uno è stimatore sufficiente e completo mentre l'altro è ancillare)...e quindi abbiamo trovato la definizione della t



MA SOLO SE IL MODELLO E' NORMALE, ALTRIMENTI IL TEOREMA DI BASU NON VALE PIU'...così come non vale più la seguente

$(n-1)S^2/sigma^2~chi_(n-1)^2$


quindi dì pure al docente di esser più preciso....altrimenti fate solo confusione

Comeover
Purtroppo no, ma conto di studiarlo nel pomeriggio e domani apro una discussione per la t-student cosi da non andare off-topic,solo una cosa il teorema di Basu è anche detto di fattorizzazione?

Comeover
In sostanza ci siamo riportati alla formula del post 6.Guarda una cosa che non sopporto della attuale didattica è che si tralasciano molte cose :? ,per caso conosci delle fonti esterne che riportano questa dimostrazione?

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.