Esercizio variabile aleatoria
Ciao, sto tentando, invano a risolvere da ore la seconda parte di questo esercizio...ma ci dev'essere qualcosa che mi sfugge.
Metto il testo e il modo in cui ho provato a risolverlo io nella speranza che qualcuno mi illumini e mi dica dove sto sbagliando!
"In una lotteria ad ogni puntata si estrae una pallina dall'urna contenente 10 palline rosse, 10 bianche e 10 verdi. Se esce il rosso si perde 1, se esce il bianco non si perde ne si vince nulla, se esce il verde si vince 1 euro.
Il signor Bianchi vuole valutare il pagamento aleatorio totale, indicato con X, di n >1 puntate.
Domanda 1: Poni n=2. Qual è la probabilità che il pagamento totale sia pari a 2 euro?
Domanda 2: Poni n=80. Qual è il massimo valore di X? Valuta $P(X <-5)$."
La mia risoluzione:
Domanda 1:Siamo in un ambito di estrazione con reinserimento, perciò la probabilità che venga estratta una pallina rossa, bianca o verde è la medesima e cioè $10/30= 0.33$
Se n=2 la $P( X=2)$ è la probabilità che in entrambe le estrazioni esca una pallina verde e cioè $(0.33)+(0.33)=0.66$
Domanda 2: Se n=80 il massimo valore che può assumere X è 80 (tutte palline verdi)
Ora arriva il punto dove mi inghippo...per valutare $P(X <-5)$
Ho calcolato il valore atteso e la deviazione standard:
$E(X)= (-1)(0.33)+(0)(0.33)+(1)(0.33)=0$
$SD(X)=0.66$
Ho poi calcolato media(che rimane 0) e deviazione standard (SD(X)/radice quadrata di 80) per il campione (n=80) al fine di standardizzare la variabile aleatoria X in questo modo (pongo Z variabile aleatoria normale standard):
$P(X <-5)$= $P(Z < (-5+0)/0.0738)$= $P(Z <-67.75)$
ovviamente impossibile da trovare
Cosa sbaglio?
Grazie mille a chi mi aiuterà!
Metto il testo e il modo in cui ho provato a risolverlo io nella speranza che qualcuno mi illumini e mi dica dove sto sbagliando!
"In una lotteria ad ogni puntata si estrae una pallina dall'urna contenente 10 palline rosse, 10 bianche e 10 verdi. Se esce il rosso si perde 1, se esce il bianco non si perde ne si vince nulla, se esce il verde si vince 1 euro.
Il signor Bianchi vuole valutare il pagamento aleatorio totale, indicato con X, di n >1 puntate.
Domanda 1: Poni n=2. Qual è la probabilità che il pagamento totale sia pari a 2 euro?
Domanda 2: Poni n=80. Qual è il massimo valore di X? Valuta $P(X <-5)$."
La mia risoluzione:
Domanda 1:Siamo in un ambito di estrazione con reinserimento, perciò la probabilità che venga estratta una pallina rossa, bianca o verde è la medesima e cioè $10/30= 0.33$
Se n=2 la $P( X=2)$ è la probabilità che in entrambe le estrazioni esca una pallina verde e cioè $(0.33)+(0.33)=0.66$
Domanda 2: Se n=80 il massimo valore che può assumere X è 80 (tutte palline verdi)
Ora arriva il punto dove mi inghippo...per valutare $P(X <-5)$
Ho calcolato il valore atteso e la deviazione standard:
$E(X)= (-1)(0.33)+(0)(0.33)+(1)(0.33)=0$
$SD(X)=0.66$
Ho poi calcolato media(che rimane 0) e deviazione standard (SD(X)/radice quadrata di 80) per il campione (n=80) al fine di standardizzare la variabile aleatoria X in questo modo (pongo Z variabile aleatoria normale standard):
$P(X <-5)$= $P(Z < (-5+0)/0.0738)$= $P(Z <-67.75)$
ovviamente impossibile da trovare
Cosa sbaglio?
Grazie mille a chi mi aiuterà!
Risposte
"Laura816":
Se n=2 la $P( X=2)$ è la probabilità che in entrambe le estrazioni esca una pallina verde e cioè $(0.33)+(0.33)=0.66$
interessante.....quindi se n=4 allora $P(x=4)=0,33+0,33+0,33+0,33=1,32$
vado anche io a giocare a questa lotteria! (Ovviamente il tuo risultato è sbagliato... dopo il mio consiglio spero tu sappia come rimediare...altrimenti non leggere nemmeno i suggerimenti seguenti perché significa che devi ancora studiare MOLTO...)
Veniamo ora al calcolo di media e varianza (che ovviamente non vanno bene)
la media effettivamente è zero....ma ti viene giusta per pura combinazione. Infatti è vero che la variabile di una giocata è la seguente
$X_(1)={{: ( -1 , 0 ,1 ),( 1/3 , 1/3 , 1/3 ) :}$
con media 0 e varianza $2/3$ ma hai sbagliato anche la deviazione std della singola variabile...0.66 (che poi arrotondato verrebbe 0,67) è la varianza, non la deviazione std
](/datas/uploads/forum/emoji/eusa_wall.gif)
Il problema è che noi siamo interessati ad un'altra variabile aleatoria che è la somma di 80 variabili indipendenti tutte distribuite come $X_(1)$..in altri termini 80 variabili iid.
Per le proprietà di tali variabili, la media della variabile somma ($SigmaX$) è pari alla somma delle medie e la varianza uguale alla somma delle varianze
quindi:
$E(SigmaX)=SigmaE(X)=0$
$V(SigmaX)=SigmaV(X)=53.33$
L'idea di utilizzare l'approssimazione con una gaussiana è corretta! però dobbiamo fare alcune osservazioni; innanzitutto, dato che il testo chiede $P(X<-5)$ sebbene con la distribuzione continua scrivere $<$ oppure $<=$ sia la stessa cosa, non dobbiamo dimenticare che la nostra distribuzione è discreta....quindi la tua probabilità viene subito $P(X<-5)=P(X<=-6)$. Inoltre, per correttezza di calcolo, non bisogna dimenticare che, nell'approssimare una distribuzione discreta con una continua occorre allargare l'intervallo di 0,5 (fattore di correzione).
In definitiva la tua standardizzazione viene così:
$P(SigmaX<-5)=P(SigmaX<=-6)=P(Z<=(-5.5-0)/(7,3))=P(Z<=-0,7351)=0,2257$
e ciò in virtù dell'immediata applicazione del Terorema del Limite Centrale che ti ricordo essere questo:
$(SigmaX-nmu)/(sigmasqrt(n))~ N(0;1)$
con i tuoi dati ottieni:
$(SigmaX-0\cdot80)/sqrt(2/3\cdot80)~ N(0;1)$
Nota1: se non avete mai fatto il fattore di correzione puoi tranquillamente utilizzare $-6$....io lo scrivo per correttezza.
Nota2: la probabilità $P(Z<-67)$ non è che è impossibile da trovare...fa ZERO.
"Laura816":in termini tecnici...hai fatto un mezzo disastro....
Cosa sbaglio?

"Laura816":prego, di nulla!....fammi sapere se hai capito le spiegazioni
Grazie mille a chi mi aiuterà!
ciao
Ciao!Intanto grazie mille per il tempo che mi hai dedicato!
Purtroppo sto preparando l'esame da non frequentante in un libro con pochi esempi pratici e con esercizi senza soluzioni per cui vado "alla cieca" nello svolgimento..
La prima parte dell'esercizio, ho fatto una cavolata!quindi modifico così:
$P(X=2)= 0.33*0.33=0.109$
(se ho sbagliato cerco un ponte per buttarmici
)
Poi per quanto riguarda media e deviazione standard non capisco dove sbaglio...le formule che uso sono queste:
la media $mu$= $ E(X_(i))=$ $SigmaX_(i)*P(X=x_(i))$
e $V(X)=$ $E(X_(i))^2-mu^2$
mi aiuti a capire perchè sono sbagliate?
Per quanto riguarda la seconda parte dell'esercizio (a parte l'interrogativo su media e varianza) sei stato veramente chiarissimo!Ti ringrazio!(mi hai anche illuminato sul fatto che per l'approssimazione delle variabili discrete scrivere < oppure ≤ non è la stessa cosa..cosa che nel mio libro non era spiegata o per lo meno non esplicitamente)
Grazie mille ancora!
Purtroppo sto preparando l'esame da non frequentante in un libro con pochi esempi pratici e con esercizi senza soluzioni per cui vado "alla cieca" nello svolgimento..
La prima parte dell'esercizio, ho fatto una cavolata!quindi modifico così:
$P(X=2)= 0.33*0.33=0.109$
(se ho sbagliato cerco un ponte per buttarmici

Poi per quanto riguarda media e deviazione standard non capisco dove sbaglio...le formule che uso sono queste:
la media $mu$= $ E(X_(i))=$ $SigmaX_(i)*P(X=x_(i))$
e $V(X)=$ $E(X_(i))^2-mu^2$
mi aiuti a capire perchè sono sbagliate?

Per quanto riguarda la seconda parte dell'esercizio (a parte l'interrogativo su media e varianza) sei stato veramente chiarissimo!Ti ringrazio!(mi hai anche illuminato sul fatto che per l'approssimazione delle variabili discrete scrivere < oppure ≤ non è la stessa cosa..cosa che nel mio libro non era spiegata o per lo meno non esplicitamente)
Grazie mille ancora!
Ho corretto la formula della varianza...avevo fatto un caos con la scrittura tra dollari

"Laura816":
Ciao!Intanto grazie mille per il tempo che mi hai dedicato!
Purtroppo sto preparando l'esame da non frequentante in un libro con pochi esempi pratici e con esercizi senza soluzioni per cui vado "alla cieca" nello svolgimento..
La prima parte dell'esercizio, ho fatto una cavolata!quindi modifico così:
$P(X=2)= 0.33*0.33=0.109$
(se ho sbagliato cerco un ponte per buttarmici)
Poi per quanto riguarda media e deviazione standard non capisco dove sbaglio...le formule che uso sono queste:
la media $mu$= $ E(X_(i))=$ $SigmaX_(i)*P(X=x_(i))$
e $V(X)=$ $E(X_(i))^2-mu^2$
mi aiuti a capire perchè sono sbagliate?![]()
il punto 1) va bene....era solo un errore di sbaglio dai...
media e varianza sono ok...mi spiego meglio
la media della variabile fa zero.
La varianza viene giustamente $(-1)^2\cdot1/3+1^2\cdot1/3=2/3$
tu invece hai detto che è la deviazione standard ad essere $2/3$...è qui l'errore
inoltre per la variabile $Y=sum_(i)X_(i)$ (che poi è la variabile che ci interessa) la varianza diventa $80V(X)=53,33$. Ciò in virtù delle proprietà della varianza; in particolare di questa
$V(X+Y)=V(X)+V(Y)$ (se le variabili sono indipendenti, come nel nostro caso)
quindi quando fai la standardizzazione $(X-mu)/sigma$ devi fare $(Y-0)/sqrt(53,33)$
la formula che volevi usare tu, ovvero questa $(bar(x)-mu)/(sigma/sqrt(n))$ non va bene perchè funziona quando vogliamo standardizzare LA MEDIA CAMPIONARIA. Noi invece siamo interessati alla probabilità del pagamento aleatorio TOTALE.....è una cosa diversa.....è una variabile che può assumere tutti i valori interi compresi fra $[-80;80]$ con media pari a 0 e deviazione standard 7,30.
Quindi è logico aspettarsi che la probabilità che tale variabile sia minore di -5 venga quanto viene a me...più o meno il 20-25%
spero sia chiaro
...per ogni necessità non esitare a chiedere

Gentilissimo!!Grazie!
Ciao!Perdonami, facendo esercizi mi è venuto un altro dubbio atroce...
La formula della deviazione standard (quando la media della popolazione $mu$ è ignota) è $S=$ $sqrt((E(X^2)-mu^2)/(n-1))$
dove ovviamente $mu^2$(stimata) $=((sumx_i)/n)^2$
Nella maggior parte degli esercizi che devo fare però ho solo i valori di $n$, $sumx_i$ e $sumx_i^2$
E finora ho calcolato $S$ così:
$S=sqrt(((sumx_i^2)-mu^2)/(n-1))$
Dopo ore ed ore di esercizi
oggi mi è venuto il dubbio che questa formula semplificata per il calcolo a mano che uso non sia corretta...(a dire il vero te l'ho chiesto perchè ho cercato riscontro e non la trovo per cui non so proprio da dove sia uscita,forse un errore che mi porto avanti da una cattiva memorizzazione?
)tu mi sai aiutare?
Grazie!
La formula della deviazione standard (quando la media della popolazione $mu$ è ignota) è $S=$ $sqrt((E(X^2)-mu^2)/(n-1))$
dove ovviamente $mu^2$(stimata) $=((sumx_i)/n)^2$
Nella maggior parte degli esercizi che devo fare però ho solo i valori di $n$, $sumx_i$ e $sumx_i^2$
E finora ho calcolato $S$ così:
$S=sqrt(((sumx_i^2)-mu^2)/(n-1))$
Dopo ore ed ore di esercizi


Grazie!
"Laura816":
E finora ho calcolato $S$ così:
$S=sqrt(((sumx_i^2)-mu^2)/(n-1))$
ciò che cerchi si chiama "deviazione standard campionaria" e ci sono diverse formule per calcolarla.....questa però davvero non esiste...ti consiglio quindi di seguire le formule che (sicuramente) ci sono sul tuo libro
Esiste ad esempio questa
$sqrt(1/Nsum_(i=1)^(N)x_(i)^2-bar(x)^2)=sqrt((sum_(i=1)^(N)(x_(i)-bar(x))^2)/N)$
oppure questa
$sqrt((sum_(i=1)^(N)(x_(i)-bar(x))^2)/(N-1)$
ma hanno scopi diversi...lo vedrai meglio quando farai inferenza
...tu hai fatto un mix (illecito) delle due versioni
Ok!Allora il mio dubbio era fondato, ora cerco di spiegare meglio cosa intendevo (nel caso sia ot apro un'altra discussione)
Certo nel mio libro ci sono le formule e ho capito che nel caso $mu$ sia nota lo stimatore giusto per $sigma$ è
$S=sqrt((sum_(i=1)^(N)(x_(i)-mu)^2)/(N)) $
mentre nel caso in cui $mu$ sia ignota lo stimatore giusto per $sigma$ è
$S= sqrt((sum_(i=1)^(N)(x_(i)-bar(x))^2)/(N-1) $
il punto è che negli esempi (e negli esercizi pratici) nel mio libro, sia che trattino di semplice stima, sia che trattino intervalli di confidenza o verifica di ipotesi, per lo svolgimento mi viene dato l'elenco di tutte le $x_(i)$ (e a quel punto mi calcolo la deviazione standard campionaria a mano con la formula classica (una di quelle scritte sopra, a seconda che $mu$ sia nota o meno)) oppure in alternativa mi danno già il dato $S$
Mentre negli esercizi(riguardanti costruzione di intervalli di confidenza o verifica di ipotesi) che il prof da all'esame generalmente riporta i dati $x_(i)$ in un diagramma ramo-foglia e genenralmente n>80 per cui il calcolo manuale di $S$ con la formula standard diventa molto laborioso, perciò ci da anche le due sommatorie: $sum_(i=1)^(N)x_(i)$ e $sum_(i=1)^(N)x_(i)^2$
Mi chiedevo che formula "semplificata" posso utilizzare in questi casi e con quei dati disponibili, nel libro non c'è traccia di nulla, a parte quest'identità:
$sum_(i=1)^(N)(x_(i)-bar(x))^2=$ $sum_(i=1)^(N)x_(i)^2-nbar(x)^2$
Io tra l'altro ho provato a verificare in due esercizi, nei quali disponevo delle $x_(i)$ e avevano quantità limitate di dati (n=20) se il risultato della formula "classica" per il calcolo di $S$ fosse uguale al risultato effettuato con l'utilizzo dell'identita e quindi
$S= sqrt((sum_(i=1)^(N)(x_(i)-bar(x))^2)/(N-1) $ $=sqrt((sum_(i=1)^(N)x_(i)^2-nbar(x)^2)/(N-1)$
ma i risultati sono diversi perciò evidentemente c'è qualcosa che sbaglio...
Certo nel mio libro ci sono le formule e ho capito che nel caso $mu$ sia nota lo stimatore giusto per $sigma$ è
$S=sqrt((sum_(i=1)^(N)(x_(i)-mu)^2)/(N)) $
mentre nel caso in cui $mu$ sia ignota lo stimatore giusto per $sigma$ è
$S= sqrt((sum_(i=1)^(N)(x_(i)-bar(x))^2)/(N-1) $
il punto è che negli esempi (e negli esercizi pratici) nel mio libro, sia che trattino di semplice stima, sia che trattino intervalli di confidenza o verifica di ipotesi, per lo svolgimento mi viene dato l'elenco di tutte le $x_(i)$ (e a quel punto mi calcolo la deviazione standard campionaria a mano con la formula classica (una di quelle scritte sopra, a seconda che $mu$ sia nota o meno)) oppure in alternativa mi danno già il dato $S$
Mentre negli esercizi(riguardanti costruzione di intervalli di confidenza o verifica di ipotesi) che il prof da all'esame generalmente riporta i dati $x_(i)$ in un diagramma ramo-foglia e genenralmente n>80 per cui il calcolo manuale di $S$ con la formula standard diventa molto laborioso, perciò ci da anche le due sommatorie: $sum_(i=1)^(N)x_(i)$ e $sum_(i=1)^(N)x_(i)^2$
Mi chiedevo che formula "semplificata" posso utilizzare in questi casi e con quei dati disponibili, nel libro non c'è traccia di nulla, a parte quest'identità:
$sum_(i=1)^(N)(x_(i)-bar(x))^2=$ $sum_(i=1)^(N)x_(i)^2-nbar(x)^2$
Io tra l'altro ho provato a verificare in due esercizi, nei quali disponevo delle $x_(i)$ e avevano quantità limitate di dati (n=20) se il risultato della formula "classica" per il calcolo di $S$ fosse uguale al risultato effettuato con l'utilizzo dell'identita e quindi
$S= sqrt((sum_(i=1)^(N)(x_(i)-bar(x))^2)/(N-1) $ $=sqrt((sum_(i=1)^(N)x_(i)^2-nbar(x)^2)/(N-1)$
ma i risultati sono diversi perciò evidentemente c'è qualcosa che sbaglio...
Scusa ma cos'è uno stimatore "giusto"????? esistono tante proprietà degli stimatori ma la "giustezza" proprio non esiste....
non distorsione
efficienza
consistenza
sufficienza
completezza
ancillarità
uno stimatore di massima verosimiglianza in genere è distorto eppure è un ottimo stimatore....ti consiglio di studiare bene la teoria prima di affrontare questi argomenti altrimenti non ne esci più...IMHO
non distorsione
efficienza
consistenza
sufficienza
completezza
ancillarità
uno stimatore di massima verosimiglianza in genere è distorto eppure è un ottimo stimatore....ti consiglio di studiare bene la teoria prima di affrontare questi argomenti altrimenti non ne esci più...IMHO
Guarda la mia pecca è quella di aver preparato l'esame da sola a casa, senza frequentare e con una bambina, non sono una ragazzina, ho ripreso in mano la materia dopo un secolo e sto cercando di fare del mio meglio, non la sto studiando da ieri ma da un mese. Probabilmente sono entrata in confusione in vista dell'esame.
Cmq mi sono espressa come si esprime il mio libro...pag 314 del ross. sheldon "introduzione alla statistica", parla di "giusto stimatore"...non l'ho detto cosi a caso ma proprio perchè ho studiato la teoria!
TI ringrazio comunque per la precisazione, la terrò a mente!
Cmq mi sono espressa come si esprime il mio libro...pag 314 del ross. sheldon "introduzione alla statistica", parla di "giusto stimatore"...non l'ho detto cosi a caso ma proprio perchè ho studiato la teoria!
TI ringrazio comunque per la precisazione, la terrò a mente!