Dubbio su stima di intervallo

ginog81
Avrei un dubbio sulla stima di intervallo o meglio su alcune considerazioni che vengono fatte su di essa.
Spero di essere chiaro e di farvi capire quali sono i miei dubbi.

Partiamo subito dal fatto che da quello che ho capito quando si costruisce la stima di intervallo (e la stessa cosa accade anche nel test di verifica delle ipotesi) bisogna distinguere vari casi per media, varianza, ecc.

Allora, per quanto riguarda la media ci sono i modelli arbitrari (cioè X con qualsiasi distribuzione qualsiasi) e i modelli normali (cioè X con distribuzione normale). Per quanto riguarda la varianza ci sono solo i modelli normali (o almeno vengono trattati solo questi nel corso che sto seguendo) e per quanto riguarda le proporizioni ci sono solo i modelli arbitrari.

Il mio dubbio per ora riguarda la media.

Da quello che ho capito quando ci troviamo con una X con distribuzione normale dobbiamo ragionare utilizzando una proprietà di $ bar (X) $ che dice:
se X ha distribuzione normale allora [($ bar (X) $ - "mi con X") / "sigma con X"] * "radice di n" ha distribuzione normale standard
Detto questo procediamo con una proprietà della distribuzione normale standard dove innanzitutto poniamo $ Z $ = [($ bar (X) $ - "mi con X") / "sigma con X"] * "radice di n" e da qui si procede con:
se Z ha distribuzione normale standard allora P(-"delta" $<=$ Z $<=$ "delta") = 1-"alfa"
Da quest'ultima proprietà ricaveremo poi che "delta" = "z con 1 - alfa/2" e quindi avremo dimostrato il perchè della seguente scrittura per costruire la stima di intervallo:
P(-"z con 1 - alfa/2" $<=$ [($ bar (X) $ - "mi con X") / "sigma con X"] * "radice di n" $<=$ "z con 1 - alfa/2") = 1-"alfa"

Innanzitutto spero di non avervi fatto venire mal di testa non utilizzando la funzione del forum per le formule ma purtroppo non ho trovato praticamente nessun simbolo di quelli che mi servivano.

Comunque, torniamo al dubbio. Dicevo, fin qui non ho problemi però mi sorgono un po' di dubbi nel caso di modelli arbitrari.
Mi spiego. Da quello che ho capito quando ci troviamo con una X con distribuzione qualsiasi dobbiamo ragionare utilizzando un'altra proprietà di $ bar (X) $ che dice:
se X ha distribuzione qualsiasi allora [($ bar (X) $ - "mi con X") / "sigma con X"] * "radice di n" ha distribuzione t-student

Detto questo la scrittura per cominciare il calcolo della stima di intervallo sarebbe:
P(-"t con n-1, 1-"alfa"/2" $<=$ [($ bar (X) $ - "mi con X") / "sigma con X"] * "radice di n" $<=$ "t con n-1, 1-"alfa"/2") = 1-"alfa"

Il dubbio che io ho è per quale motivo ci sono proprio quei due estremi in questo caso.
Io se vi dovessi rispondere in questo momento vi direi perchè i quantili della distribuzione t-student sono quelli ma non so se basterebbe come risposta.

Il dubbio mi è venuto perchè mentre nel primo caso (i modelli normali) so dare una spiegazione alla presenza di quei due estremi in questo caso invece (modelli arbitrari) più che dirvi appunto quali sono i quantili della distribuzione t-student non saprei dire.





mi aiutate a capire?









p.s. se le formule che vi ho scritto vi sembrano troppo difficili da interpretare posso anche scriverle a mano e scannerizzarvele. non è un problema. l'importante è che capisco. :wink:

Risposte
ginog81
ragazzi nessuno mi sa aiutare?

Rggb1
E' che non riesco a leggere... sinceramente non ho capito. Vuoi sapere perché si usa la t di Student?

ginog81
il perchè si usa la distribuzione t-student penso di averlo capito e cioè:

se X ha distribuzione qualsiasi allora ha distribuzione t-student

quello che non riesco a capire è il perchè vale questa uguaglianza ma più che altro in particolare perchè è compresa tra quei due quantili.
Io come già detto risponderei "perchè quelli sono i quantili della distribuzione t-student" ma non credo possa bastare come risposta.

Cmax1
Non ho capito precisamente quali siano i dubbi, comunque tieni conto di alcune proprietà:
1) Se [tex]X[/tex] ha una distribuzione con media [tex]\mu[/tex] e varianza [tex]\sigma^2[/tex], allora la media campionaria [tex]\bar{x}[/tex] ha distribuzione del medesimo tipo con media [tex]\mu[/tex] e varianza [tex]\sigma^2/N[/tex]. La variabile standardizzata (cioè con media nulla e varianza unitaria) che si ricava da [tex]\bar{x}[/tex] diventa allora [tex]\displaystyle \xi=\frac{\bar{x}-\mu}{\sigma/\sqrt{N}}[/tex]
2) se [tex]X[/tex] è una normale e [tex]\sigma[/tex] è un parametro noto, allora [tex]\xi[/tex] è una variabile normale standard.
3) se [tex]\sigma[/tex] non è noto, si usa lo stimatore [tex]\displaystyle S^2=\frac{1}{N-1} \sum_{i=1}^N (x_i-\bar{x})^2[/tex]. Se [tex]X[/tex] ha una distribuzione normale, la variabile [tex]\eta = (N-1)S^2/\sigma^2[/tex] segue una distribuzione [tex]\chi^2_{N-1}[/tex], e la variabile [tex]\displaystyle \tau=\frac{\bar{x}-\mu}{\sqrt{S^2/N}}[/tex] segue una t-Student (definita appunto come rapporto tra una normale standard ed un chi quadrato).
Credo che su qualsiasi testo di statistica trovi i dettagli dei passaggi.

ginog81
"Cmax":

1) Se [tex]X[/tex] ha una distribuzione con media [tex]\mu[/tex] e varianza [tex]\sigma^2[/tex], allora la media campionaria [tex]\bar{x}[/tex] ha distribuzione del medesimo tipo con media [tex]\mu[/tex] e varianza [tex]\sigma^2/N[/tex]. La variabile standardizzata (cioè con media nulla e varianza unitaria) che si ricava da [tex]\bar{x}[/tex] diventa allora [tex]\displaystyle \xi=\frac{\bar{x}-\mu}{\sigma/\sqrt{N}}[/tex]


Allora, questo è il passaggio, utilizzando il teorema del limite centrale, per arrivare alla standardizzazione.
Il mio dubbio viene nel caso della X con distribuzione normale, insomma ho capito che in quel caso la media campionaria ha distribuzione t-student e fin qui ci siamo, anche perchè è una proprietà.
Quello che non riesco a capire è il perchè la standardizzazione, come ho già scritto prima, risulta compresa tra quei due quantili. Ok, quelli sono i quantili della distribuzione t-student ma basterebbe come risposta?

Io per quanto riguarda il caso di X con qualsiasi tipo di distribuzione non ho problemi e so spiegare il motivo del perchè la standardizzazione risulta compresa tra i quantili della distribuzione normale standard ma nell'altro caso proprio non riesco a capire.



EDIT:
ecco il caso che vi dicevo di aver capito, cioè se X ha distribuzione qualsiasi allora la standardizzazione ha distribuzione normale standard.
questa di sotto è la dimostrazione del perchè la standardizzazione risulta compresa tra quei quantili (ho imposto Z=standardizzazione):


insomma in parole povere non so come fare lo stesso tipo di ragionamento anche per l'altro caso.











p.s. scusate se vi faccio un'altra domanda senza aver prima chiarito l'altra ma è davvero urgente.
cosa si intende per classe dei test ammissibili? io da quello che ho capito la classe dei test ammissibili è un insieme di test che soddisfano una condizione del tipo "Si rifiuta H0 se $ bar (X) $ < c". E' corretto? Se no, potreste dirmi in cosa consiste? non vorrei fare delle considerazioni errate spiegando un esercizio sul test di verifica delle ipotesi.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.