Intervallo confidenza media esponenziali
Ciao, amici! Avendo una riserva infinita di oggetti con tempi di vita indipendenti e identicamente distribuiti esponenzialmente con media incognita $\theta$, si esaminano sequenzialmente tali oggetti mettendone in funzione uno nuovo ogni volta che si guasti il precedente, terminando l'esperimento dopo un tempo prefissato $T$ (che quindi direi proprio che non è una variabile aleatoria, a scanso di equivoci, data anche la notazione maiuscola, che utilizzo solo per conformità con mio testo), al termine del quale i guasti osservati risultano essere $r$ guasti. Si dimostra nel mio testo (qui a p. 593) che lo stimatore di massima verosimiglianza di $\theta$ è $\hat{\theta}=T/{N(T)}$ dove $N(T)$ è la quantità (variabile aleatoria, quindi) di guasti osservati fino all'istante $T$.
Quello che non capisco è come il mio testo calcola un intervallo di confidenza ad un livello $1-\alpha$ per tale valore atteso $\theta$: si mostra che esistono (a p. 594) due valori $\theta_\text{I}$ e $\theta_\text{S}$ tali che\[P(N(T)\geq r|\theta=\theta_\text{S})\overset{\text{def}}{=}P_{\theta_\text{S}}(N(T)\geq r)=\frac{\alpha}{2}\text{ }\text{ e }P(N(T)\leq r|\theta=\theta_\text{I})\overset{\text{def}}{=}P_{\theta_\text{I}}(N(T)\leq r)=\frac{\alpha}{2}\] "In queste ipotesi" dice il mio libro, S. M. Ross, Probabilità e statistica per l'ingegneria e le scienze, seconda edizione in lingua italiana, 2008, pp. 593 e 594 qui, "vi è un livello di confidenza $1-\alpha$ che \(\theta\in(\theta_\text{I},\theta_\text{S})\). Per capire il motivo di tale affermazione, si noti intanto che \(P_\theta(N(T)\leq r)\) cresce con $\theta$ mentre \(P_\theta(N(T)\geq r)\) decresce. Di conseguenza\[\theta<\theta_\text{I}\Rightarrow P_\theta(N(T)\leq r)\theta_\text{S}\Rightarrow P_\theta(N(T)\geq r)
E quest'ultima affermazione è ciò che non capisco. Non sono sicuro di aver capito di che evento si tratti e che cosa c'entri con l'intervallo di confidenza di livello $1-\alpha$ definito (mi si perdoni se la mia definizione è un po' contorta, ma spero di essermi avvicinato a quel che è) come intervallo definito dalla probabilità $1-\alpha$ che una o due variabili aleatorie stiano agli estremi tra i quali si trova il parametro da stimare: prima di osservare il valore assunto da tale/i variabile/i si ha una probabilità, dopo si parla di confidenza.
Qualcuno sarebbe così buono da aiutarmi a fare luce su questa faccenda?
Io interpreterei così ciò che dice il mio testo, ma temo di dire stupidaggini: dato che mi pare che
$P(N(T)= r,\theta\leq\theta_{\text{I}})+P(N(T)= r,\theta\geq\theta_{\text{S}})\leq P(N(T)\leq r,\theta\leq\theta_{\text{I}})+P(N(T)\geq r,\theta\geq\theta_{\text{S}})$
$=P(\theta\leq\theta_{\text{I}})P(N(T)\leq r|\theta\leq\theta_{\text{I}}) +P(\theta\geq\theta_{\text{S}})P(N(T)\geq r|\theta\geq\theta_{\text{S}})$
$ $P(N(T)= r)P(\theta\leq\theta_{\text{I}}|N(T)= r)+P(N(T)= r)P(\theta\geq\theta_{\text{S}}|N(T)= r)$
$=P(N(T)=r)P(\theta\notin (\theta_\text{I},\theta_\text{S})|N(T)= r)<\alpha$ e subordinando al verificarsi dell'evento \(\{N(T)=r\}\), da noi effettivamente osservato, direi che
$P(\theta\notin (\theta_\text{I},\theta_\text{S})|N(T)= r)<\alpha$ per cui mi sembra che
$P(\theta\in (\theta_\text{I},\theta_\text{S})|N(T)= r)>1-\alpha$ per cui, se non le ho sparate troppo grosse, sarebbe così dimostrato che tale valore $1-\alpha$ è un minorante del livello di confidenza per $\theta$ dell'intervallo \((\theta_\text{I},\theta_\text{S})\), come da definizione di intervallo di confidenza.
Ma temo di averle sparate grosse...
Un grazie di cuore a chi vorrà tirarmi un salvagente...
Quello che non capisco è come il mio testo calcola un intervallo di confidenza ad un livello $1-\alpha$ per tale valore atteso $\theta$: si mostra che esistono (a p. 594) due valori $\theta_\text{I}$ e $\theta_\text{S}$ tali che\[P(N(T)\geq r|\theta=\theta_\text{S})\overset{\text{def}}{=}P_{\theta_\text{S}}(N(T)\geq r)=\frac{\alpha}{2}\text{ }\text{ e }P(N(T)\leq r|\theta=\theta_\text{I})\overset{\text{def}}{=}P_{\theta_\text{I}}(N(T)\leq r)=\frac{\alpha}{2}\] "In queste ipotesi" dice il mio libro, S. M. Ross, Probabilità e statistica per l'ingegneria e le scienze, seconda edizione in lingua italiana, 2008, pp. 593 e 594 qui, "vi è un livello di confidenza $1-\alpha$ che \(\theta\in(\theta_\text{I},\theta_\text{S})\). Per capire il motivo di tale affermazione, si noti intanto che \(P_\theta(N(T)\leq r)\) cresce con $\theta$ mentre \(P_\theta(N(T)\geq r)\) decresce. Di conseguenza\[\theta<\theta_\text{I}\Rightarrow P_\theta(N(T)\leq r)
Qualcuno sarebbe così buono da aiutarmi a fare luce su questa faccenda?
Io interpreterei così ciò che dice il mio testo, ma temo di dire stupidaggini: dato che mi pare che
$P(N(T)= r,\theta\leq\theta_{\text{I}})+P(N(T)= r,\theta\geq\theta_{\text{S}})\leq P(N(T)\leq r,\theta\leq\theta_{\text{I}})+P(N(T)\geq r,\theta\geq\theta_{\text{S}})$
$=P(\theta\leq\theta_{\text{I}})P(N(T)\leq r|\theta\leq\theta_{\text{I}}) +P(\theta\geq\theta_{\text{S}})P(N(T)\geq r|\theta\geq\theta_{\text{S}})$
$ $P(N(T)= r)P(\theta\leq\theta_{\text{I}}|N(T)= r)+P(N(T)= r)P(\theta\geq\theta_{\text{S}}|N(T)= r)$
$=P(N(T)=r)P(\theta\notin (\theta_\text{I},\theta_\text{S})|N(T)= r)<\alpha$ e subordinando al verificarsi dell'evento \(\{N(T)=r\}\), da noi effettivamente osservato, direi che
$P(\theta\notin (\theta_\text{I},\theta_\text{S})|N(T)= r)<\alpha$ per cui mi sembra che
$P(\theta\in (\theta_\text{I},\theta_\text{S})|N(T)= r)>1-\alpha$ per cui, se non le ho sparate troppo grosse, sarebbe così dimostrato che tale valore $1-\alpha$ è un minorante del livello di confidenza per $\theta$ dell'intervallo \((\theta_\text{I},\theta_\text{S})\), come da definizione di intervallo di confidenza.
Ma temo di averle sparate grosse...
Un grazie di cuore a chi vorrà tirarmi un salvagente...
Risposte
Grazie di cuore, Sergio...
Credo di avere centrato che cos'è un intervallo di confidenza, ma la mia interpretazione (econdo "paragrafo" del messaggio di sopra) di che cosa intende il Ross quando dice che se $ \theta $ fosse esterna all'intervallo \( (\theta_\text{I},\theta_\text{S}) \), il valore osservato $ r $ sarebbe così estremo da richiedere il verificarsi di un evento di probabilità inferiore ad $ \alpha $ ti sembra, a te e a chi voglia intervenire, avere un qualche senso?
Con i miei calcoli, chiamando \( C(N(T))=(\theta_\text{I},\theta_\text{S}) \) l'intervallo dipendente dalla variabile aleatoria \(N(T)\) mi sembra di ottenere che \(P(\theta\in C(N(T))|N(T)=r)>1-\alpha\), che direi che giustificherebbe l'intervallo di confidenza descritto dal Ross: hanno una qualche parvenza di essere corretti questi miei calcoli?
$\infty$ grazie ancora e buon agosto!!!
Credo di avere centrato che cos'è un intervallo di confidenza, ma la mia interpretazione (econdo "paragrafo" del messaggio di sopra) di che cosa intende il Ross quando dice che se $ \theta $ fosse esterna all'intervallo \( (\theta_\text{I},\theta_\text{S}) \), il valore osservato $ r $ sarebbe così estremo da richiedere il verificarsi di un evento di probabilità inferiore ad $ \alpha $ ti sembra, a te e a chi voglia intervenire, avere un qualche senso?
Con i miei calcoli, chiamando \( C(N(T))=(\theta_\text{I},\theta_\text{S}) \) l'intervallo dipendente dalla variabile aleatoria \(N(T)\) mi sembra di ottenere che \(P(\theta\in C(N(T))|N(T)=r)>1-\alpha\), che direi che giustificherebbe l'intervallo di confidenza descritto dal Ross: hanno una qualche parvenza di essere corretti questi miei calcoli?
$\infty$ grazie ancora e buon agosto!!!
Grazie ancora per la risposta, Sergio!!!!!!
Credo di aver chiaro che cosa sia il p-value: è la probabilità (la quale è maggiorante la probabilità -diciamo \(P_{H_0}(\theta\notin C( \mathbf{X}_n))\)- di "trovare" un certo parametro $\theta$ in un certo sottoinsieme -diciamo \(\mathbb{R}\setminus C( \mathbf{X}_n)\)- sotto l'ipotesi nulla) che una variabile aleatoria, opportunamente scelta a seconda del test, stia in un certo intervallo cui appartiene il valore calcolato per la statistica del test in questione: il test conseguentemente rifiuta l'ipotesi per livelli di significatività maggiori del p-value...
P.S.: Che faticaccia scrivere mentre continuo a venire "buttato fuori"...
Credo di aver chiaro che cosa sia il p-value: è la probabilità (la quale è maggiorante la probabilità -diciamo \(P_{H_0}(\theta\notin C( \mathbf{X}_n))\)- di "trovare" un certo parametro $\theta$ in un certo sottoinsieme -diciamo \(\mathbb{R}\setminus C( \mathbf{X}_n)\)- sotto l'ipotesi nulla) che una variabile aleatoria, opportunamente scelta a seconda del test, stia in un certo intervallo cui appartiene il valore calcolato per la statistica del test in questione: il test conseguentemente rifiuta l'ipotesi per livelli di significatività maggiori del p-value...
P.S.: Che faticaccia scrivere mentre continuo a venire "buttato fuori"...