Dubbio calcolo p-value
Salve a tutti, non riesco a svolgere questo esercizio apparentemente semplice utilizzando il p-value:
$\bar X n: 21912,96$ (media campionaria)
$S_c: 18233,97$
$n = 52$
$\alpha = 0,05$
$\{(H_0: μ = 30000),(H_1: μ > 30000):}$
So che la soluzione è che accetto $H_0$ perché ho provato a risolvere questo esercizio con il metodo "classico", ma se utilizzo p-value giungo (a errore) ad un risultato differente. Vi mostro i calcoli eseguiti col metodo classico:
$Txn = -3,198232$
$T_51;_0,_95 ≃ 1,6759$
Accetto $H_0$ perché $Txn$ < $T_51;_0,_95$
Adesso provo ad utilizzare p-value:
$P (t > -3,198232)$
$1-P (t > 3,198232)$
$1 - [1-P (t < 3,198232)]$
$t < 3,198232$ è compreso tra: $T_51;_0,_995 ≃ 2,6778$ e $T_51;_0,_999 ≃ 3,2614$
Quindi il valore è compreso tra $\alpha = 0,001$ e $0,005$ (attraverso una serie di calcoli sono arrivato a trovare $0,001432954$). Quindi:
$1 - [1-P (t < 3,198232)] = 0,001432954$
Conclusione: $p-value$ < $\alpha$ quindi rifiuto $H_0$.
Dov'è l'errore?
Vi ringrazio per l'attenzione e mi scuso per la lunghezza
$\bar X n: 21912,96$ (media campionaria)
$S_c: 18233,97$
$n = 52$
$\alpha = 0,05$
$\{(H_0: μ = 30000),(H_1: μ > 30000):}$
So che la soluzione è che accetto $H_0$ perché ho provato a risolvere questo esercizio con il metodo "classico", ma se utilizzo p-value giungo (a errore) ad un risultato differente. Vi mostro i calcoli eseguiti col metodo classico:
$Txn = -3,198232$
$T_51;_0,_95 ≃ 1,6759$
Accetto $H_0$ perché $Txn$ < $T_51;_0,_95$
Adesso provo ad utilizzare p-value:
$P (t > -3,198232)$
$1-P (t > 3,198232)$
$1 - [1-P (t < 3,198232)]$
$t < 3,198232$ è compreso tra: $T_51;_0,_995 ≃ 2,6778$ e $T_51;_0,_999 ≃ 3,2614$
Quindi il valore è compreso tra $\alpha = 0,001$ e $0,005$ (attraverso una serie di calcoli sono arrivato a trovare $0,001432954$). Quindi:
$1 - [1-P (t < 3,198232)] = 0,001432954$
Conclusione: $p-value$ < $\alpha$ quindi rifiuto $H_0$.
Dov'è l'errore?
Vi ringrazio per l'attenzione e mi scuso per la lunghezza
Risposte
giusto per tua informazione: in questa stanza se non inizi a scrivere le formule in modo corretto difficilmente qualcuno ti risponderà. Ci sono tutte le istruzioni nel box rosa in alto
Inoltre, sempre da regolamento, il testo del problema va scritto per intero, in forma estesa e senza limitarsi ad inserire link, foto o immagini...qui il testo del problema non c'è. Per esempio non si dice che la distribuzione sorgente è Gaussiana.....e senza questo "dettaglio" non ha senso usare una t di Student. In mancanza di un testo non è possibile nemmeno verificare che tu abbia scritto il sistema di ipotesi in modo corretto (cosa che evidentemente non è...)
In questo momento sono a Detroit e sto lavorando, quindi non ho molto tempo di guardare i tuoi conti ma, è evidente che
il tuo sistema di ipotesi è posto male. Il sistema che hai scritto tu è equivalente al seguente[nota]per una dettagliata spiegazione del perché, puoi guardare qui[/nota]
quindi se la media campionaria (statistica test) è circa 22.000 ovvero $bar(x) in Theta_0$ non vi è nulla da provare. Si accetta l'ipotesi di lavoro e stop. Vi sarebbe qualche cosa da provare solo se i dati campionari contrastassero l'ipotesi di lavoro, ovvero se trovassi una media campionaria maggiore di 30.000.
Se proprio vuoi fare i conti, anche mentalmente, puoi fare così: con $n=52$ è pure superfluo usare la t di Student ma puoi usare tranquillamente la Gaussiana senza perdere grandi informazioni... a questo punto è chiaro che la regione di rifiuto del tuo sistema sarà $z_("stat")>2$ (più o meno eh, viene $1.64$ con la gaussiana e $1.68$ con la t di Student)
a te viene un valore dello $z_("stat")~~-3$ negativo..... quindi ovviamente accetti ed il pvalue sarà altssimo.....intorno a 1. Pensa, senza fare conti, all'area sottesa alla gaussiana per $z> -3$....viene praticamente 1, che è il tuo pvalue...e tu rifiuti quando il pvalue è piccolo....
Forse è meglio se ti chiarisci un po' le idee sui test prima di fare esercizi. Su questa piattaforma ho risolto e commentato centinaia di esercizi che puoi trovare semplicemente digitando le parole chiave nella casellina "cerca"
Spero di esserti stato utile e spero altresì che al tuo prossimo eventuale topic sarai in grado di scrivere due formulette in modo chiaro e leggibile
quindi, riassumendo, il primo errore è quello di aver scritto male il sistema di ipotesi (probabilmente mal interpretando il testo della traccia che non conosco perché non l'hai scritto)
Con il sistema così scritto ti devi trovare un pvalue vicino a uno e quindi coerente con il metodo classico, come lo chiami tu. Non serve fare tanti conti con la t di Student, basta usare la Gaussiana e cacolare
$P(Z> -3) rarr 1$
e questo è il tuo pvalue.
cordiali saluti
Inoltre, sempre da regolamento, il testo del problema va scritto per intero, in forma estesa e senza limitarsi ad inserire link, foto o immagini...qui il testo del problema non c'è. Per esempio non si dice che la distribuzione sorgente è Gaussiana.....e senza questo "dettaglio" non ha senso usare una t di Student. In mancanza di un testo non è possibile nemmeno verificare che tu abbia scritto il sistema di ipotesi in modo corretto (cosa che evidentemente non è...)
In questo momento sono a Detroit e sto lavorando, quindi non ho molto tempo di guardare i tuoi conti ma, è evidente che
il tuo sistema di ipotesi è posto male. Il sistema che hai scritto tu è equivalente al seguente[nota]per una dettagliata spiegazione del perché, puoi guardare qui[/nota]
${{: ( mathcal(H)_0:mu<=30.000 ),( mathcal(H)_1:mu>30.000 ):}$
quindi se la media campionaria (statistica test) è circa 22.000 ovvero $bar(x) in Theta_0$ non vi è nulla da provare. Si accetta l'ipotesi di lavoro e stop. Vi sarebbe qualche cosa da provare solo se i dati campionari contrastassero l'ipotesi di lavoro, ovvero se trovassi una media campionaria maggiore di 30.000.
Se proprio vuoi fare i conti, anche mentalmente, puoi fare così: con $n=52$ è pure superfluo usare la t di Student ma puoi usare tranquillamente la Gaussiana senza perdere grandi informazioni... a questo punto è chiaro che la regione di rifiuto del tuo sistema sarà $z_("stat")>2$ (più o meno eh, viene $1.64$ con la gaussiana e $1.68$ con la t di Student)
a te viene un valore dello $z_("stat")~~-3$ negativo..... quindi ovviamente accetti ed il pvalue sarà altssimo.....intorno a 1. Pensa, senza fare conti, all'area sottesa alla gaussiana per $z> -3$....viene praticamente 1, che è il tuo pvalue...e tu rifiuti quando il pvalue è piccolo....
Forse è meglio se ti chiarisci un po' le idee sui test prima di fare esercizi. Su questa piattaforma ho risolto e commentato centinaia di esercizi che puoi trovare semplicemente digitando le parole chiave nella casellina "cerca"
Spero di esserti stato utile e spero altresì che al tuo prossimo eventuale topic sarai in grado di scrivere due formulette in modo chiaro e leggibile
"iss_2907":
Dov'è l'errore?
quindi, riassumendo, il primo errore è quello di aver scritto male il sistema di ipotesi (probabilmente mal interpretando il testo della traccia che non conosco perché non l'hai scritto)
Con il sistema così scritto ti devi trovare un pvalue vicino a uno e quindi coerente con il metodo classico, come lo chiami tu. Non serve fare tanti conti con la t di Student, basta usare la Gaussiana e cacolare
$P(Z> -3) rarr 1$
e questo è il tuo pvalue.
cordiali saluti
Innanzitutto ti ringrazio per la risposta
Credevo che scrivere il testo in formule fosse obbligatorio per gli utenti che abbiano più di 30 post, ho provveduto comunque a modificare il messaggio.
Il testo del problema non c'è perché l'ho scritto io sulla base di una ricerca che sto facendo (devo creare un test d'ipotesi). La distribuzione comunque è normale.
Se ho capito bene, mi stai dicendo che "l'esercizio" che ho postato non ha molto senso (o comunque è un esercizio "insolito") perché $H_0$ non è in contrasto con la media campionaria.
...a questo punto se il testo dell'esercizio fosse: $\{(H_0: μ ≥ 30000),(H_1: μ < 30000):}$
il sistema di ipotesi sarebbe impostato bene ma IMHO essendo che i calcoli da fare sarebbero identici a quelli fatti nel primo post, rimarrei comunque bloccato (metodo classico e p-value portano a risultati differenti).
Come faccio
EDIT: visto che nel primo post il p-value è bassissimo, credo di aver fatto il procedimento con $H_1: μ < 30000$
Credevo che scrivere il testo in formule fosse obbligatorio per gli utenti che abbiano più di 30 post, ho provveduto comunque a modificare il messaggio.
Il testo del problema non c'è perché l'ho scritto io sulla base di una ricerca che sto facendo (devo creare un test d'ipotesi). La distribuzione comunque è normale.
Se ho capito bene, mi stai dicendo che "l'esercizio" che ho postato non ha molto senso (o comunque è un esercizio "insolito") perché $H_0$ non è in contrasto con la media campionaria.
...a questo punto se il testo dell'esercizio fosse: $\{(H_0: μ ≥ 30000),(H_1: μ < 30000):}$
il sistema di ipotesi sarebbe impostato bene ma IMHO essendo che i calcoli da fare sarebbero identici a quelli fatti nel primo post, rimarrei comunque bloccato (metodo classico e p-value portano a risultati differenti).
Come faccio

EDIT: visto che nel primo post il p-value è bassissimo, credo di aver fatto il procedimento con $H_1: μ < 30000$
[ot]
certo, per gli utenti con più di 30 messaggi gli chiudo la discussione.....a te ho fatto un cortese invito. Però permettimi di essere un poco contrariato da questo atteggiamento....dato che non è obbligatorio allora scrivi il topic da cane, e lasci che gli altri perdano tempo a tradurre gli sgorbi che avevi scritto??????
Ti posso assicurare che se avessi letto prima questo commento non avrei mai risposto ad un tuo quesito e molto probabilmente sarà ciò che farò in futuro[/ot]
Ormai che ho risposto, termino la spiegazione:
una volta trovata la statistica test che è sempre $z_(stat)=-3$ (circa)
avrai che rifiuti $H_0$ dato che $-3<-2$ (che non sarà esattamente -2 ma sarà $-1.64$ con la gaussiana o $-1.68$ con la t, poco cambia a livello concettuale)
e che il pvalue è piccolissimo essendo $P(Z< -3) rarr 0$
arrivando con entrambi i metodi allo stesso risultato
I due metodi non possono portare a conclusioni differenti; uno confronta le ascisse della distribuzione, l'altro l'area della coda.....
L'esercizio che hai scritto non è insolito, è proprio senza senso. Ti consiglio di nuovo una bella lettura della teoria sottostante
In poche parole e senza formalismi: a cosa serve un test di ipotesi?
Noi supponiamo da precedenti informazioni che la media sia 10 contro l'alternativa che sia più alta
....estraiamo dei dati campionari e troviamo una media di 8. Stop, non c'è nulla da provare; i dati campionari sono coerenti con il nostro pensiero.
Infatti come ben spiegato nel link che ti ho indicato sopra, i due sistemi seguenti sono del tutto equivalenti
Pensa invece se estrai i dati e ti viene una media di 12....allora è giusto chiedersi se 12 è davvero maggiore di 10 oppure la differenza di $+2$ è dovuta alla variabilità del fenomeno.....ecco qui applichi un test statistico di "verifica" della significatività del tuo 12 rispetto al 10 che avresti voluto trovare. La significatività è data dal tuo pvalue...più è basso e più il test è significativo, perché ad un pvalue basso corrisponde un'ascissa alta (in valore assoluto ovviamente) e quindi una maggior differenza con il dato medio....cioè una differenza più significativa
Con questo spero di aver chiarito tutto, ti auguro una buona permanenza nel forum e ti saluto cordialmente
"iss_2907":
Credevo che scrivere il testo in formule fosse obbligatorio per gli utenti che abbiano più di 30 post,
certo, per gli utenti con più di 30 messaggi gli chiudo la discussione.....a te ho fatto un cortese invito. Però permettimi di essere un poco contrariato da questo atteggiamento....dato che non è obbligatorio allora scrivi il topic da cane, e lasci che gli altri perdano tempo a tradurre gli sgorbi che avevi scritto??????
Ti posso assicurare che se avessi letto prima questo commento non avrei mai risposto ad un tuo quesito e molto probabilmente sarà ciò che farò in futuro[/ot]
Ormai che ho risposto, termino la spiegazione:
una volta trovata la statistica test che è sempre $z_(stat)=-3$ (circa)
avrai che rifiuti $H_0$ dato che $-3<-2$ (che non sarà esattamente -2 ma sarà $-1.64$ con la gaussiana o $-1.68$ con la t, poco cambia a livello concettuale)
e che il pvalue è piccolissimo essendo $P(Z< -3) rarr 0$
arrivando con entrambi i metodi allo stesso risultato
I due metodi non possono portare a conclusioni differenti; uno confronta le ascisse della distribuzione, l'altro l'area della coda.....
L'esercizio che hai scritto non è insolito, è proprio senza senso. Ti consiglio di nuovo una bella lettura della teoria sottostante
In poche parole e senza formalismi: a cosa serve un test di ipotesi?
Noi supponiamo da precedenti informazioni che la media sia 10 contro l'alternativa che sia più alta
....estraiamo dei dati campionari e troviamo una media di 8. Stop, non c'è nulla da provare; i dati campionari sono coerenti con il nostro pensiero.
Infatti come ben spiegato nel link che ti ho indicato sopra, i due sistemi seguenti sono del tutto equivalenti
${{: ( mathcal(H)_0:mu=mu_0 ),( mathcal(H)_1:mu>mu_0 ) :} harr{{: ( mathcal(H)_0:mu<=mu_0 ),( mathcal(H)_1:mu>mu_0 ) :} $
Pensa invece se estrai i dati e ti viene una media di 12....allora è giusto chiedersi se 12 è davvero maggiore di 10 oppure la differenza di $+2$ è dovuta alla variabilità del fenomeno.....ecco qui applichi un test statistico di "verifica" della significatività del tuo 12 rispetto al 10 che avresti voluto trovare. La significatività è data dal tuo pvalue...più è basso e più il test è significativo, perché ad un pvalue basso corrisponde un'ascissa alta (in valore assoluto ovviamente) e quindi una maggior differenza con il dato medio....cioè una differenza più significativa
Con questo spero di aver chiarito tutto, ti auguro una buona permanenza nel forum e ti saluto cordialmente
[ot]
Ti chiedo scusa e chiedo scusa a tutta la community di matematicamente, credevo che il testo fosse abbastanza leggibile e siccome nel momento in cui ho aperto il topic andavo di fretta ho pensato fosse lecito, tutto qui[/ot]
Adesso ho capito, grazie per l'esaustiva spiegazione.
Se hai ancora intenzione di rispondere, se il testo cambiasse in:
$\{(H_0: μ ≥ 30000),(H_1: μ < 30000):}$
$p-value$ dovrebbe essere bassissimo (quindi il valore che ho scritto nel primo post 0,001432954 è plausibile)
$\alpha = 0,05$
$p-value < \alpha$
La conclusione sarebbe di rifiutare $H_0$. È corretto?
"tommik":
certo, per gli utenti con più di 30 messaggi gli chiudo la discussione.....a te ho fatto un cortese invito. Però permettimi di essere un poco contrariato da questo atteggiamento....dato che non è obbligatorio allora scrivi il topic da cane, e lasci che gli altri perdano tempo a tradurre gli sgorbi che avevi scritto??????
Ti posso assicurare che se avessi letto prima questo commento non avrei mai risposto ad un tuo quesito e molto probabilmente sarà ciò che farò in futuro
Ti chiedo scusa e chiedo scusa a tutta la community di matematicamente, credevo che il testo fosse abbastanza leggibile e siccome nel momento in cui ho aperto il topic andavo di fretta ho pensato fosse lecito, tutto qui[/ot]
Adesso ho capito, grazie per l'esaustiva spiegazione.
Se hai ancora intenzione di rispondere, se il testo cambiasse in:
$\{(H_0: μ ≥ 30000),(H_1: μ < 30000):}$
$p-value$ dovrebbe essere bassissimo (quindi il valore che ho scritto nel primo post 0,001432954 è plausibile)
$\alpha = 0,05$
$p-value < \alpha$
La conclusione sarebbe di rifiutare $H_0$. È corretto?