Chiarimento ragionamento per variabili aleatorie

MasaOverflow
Sono alle prime armi con la statistica e ho dei dubbi con alcuni esercizi sulle variabili aleatorie, purtroppo non sono stati forniti risultati con cui potersi confrontare e non ho modo di sapere se il mio ragionamento è corretto.

Vi propongo uno di questi esercizi e il ragionamento che usato per risolverli:

Date 10 palline da un'urna, 5 di queste sono rosse, 3 nere e 2 bianche.

\(\displaystyle X,Y \) sono le variabili aleatorie che contano il numero di palline rosse estratte facendo 3 estrazioni consecutive con e senza reintegro. Si rappresentino le relative distribuzioni e si calcolino valore atteso e varianza.

Ho posto:

\(\displaystyle X = \) estrazioni con reintegro.
\(\displaystyle Y = \) estrazioni senza reintegro.

Procedo a calcolare \(\displaystyle X \);

La probabilità di estrarre una singola pallina rossa è \(\displaystyle p = \frac{1}{2} \), mentre la probabilità di estrarre una qualsiasi altra pallina è \(\displaystyle q = \frac{1}{2} \). Essendo il risultato del problema basato solo su due valori "successo/insuccesso" ho trattato la variabile aleatoria X come una variabile Bernoulliana ed ottengo la funzione di probabilità:

\(\displaystyle \frac{1}{2} \) se successo

\(\displaystyle \frac{1}{2} \) se insuccesso

\(\displaystyle 0 \) altrimenti

Ora devo valutare il tutto su tre estrazioni dunque calcolo tre eventi \(\displaystyle P_i \) in cui la pallina rossa può essere estratta 1, 2, 3 volte:

\(\displaystyle P_1(SII) = \frac{1}{2} * \frac{1}{2} * \frac{1}{2} = \frac{1}{8} \);
Moltiplico a \(\displaystyle P_1(SII) \) tutte le possibili permutazioni della stringa \(\displaystyle SII \): \(\displaystyle P_1 = \frac{1}{8} * 3 \)

Faccio lo stesso per \(\displaystyle P_2(SSI) = \frac{1}{8}*3 \) e per \(\displaystyle P_3(SSS) = \frac{1}{8} \)

L'evento ha quindi probabilità \(\displaystyle P = \frac{1}{8}*3 + \frac{1}{8}*3 + \frac{1}{8} = \frac{7}{8} \)

Gli ultimi due punti del problema mi chiedono di trovare valore atteso e varianza, ma essendo una variabile Bernoulliana sono noti:

Valore atteso: \(\displaystyle \frac{1}{2} \)

Varianza: \(\displaystyle \frac{1}{4} \)

Per la variabile Y invece non posso usare la variabile Bernoulliana perchè ammette diversi valori per successi e insuccessi, quindi la tratto come una funzione di probabilità \(\displaystyle Y = \{x_1 ... x_n\} = \{ \frac{1}{2}, \frac{4}{9}, \frac{3}{8} \} \)
avvalendomi della proprietà che cambiando l'ordine di estrazione i risultati rimangono gli stessi. Infine calcolo valore atteso e varianza utilizzando le formule note.

Sono giusti nel primo e nel secondo caso i ragionamenti e i risultati? Oppure sto solo inventando? :P

Risposte
hamming_burst
Ciao,
Sì è ben corretto in qualche senso, ma secondo me potresti essere un po' più formale nella descrizione notando:

1) sai che gli eventi sono indipendenti e che segue uno schema di Bernoulli. Perciò non UN singolo successo/insuccesso ma una serie di prove $n$, allora sarà una Binomiale.
Il numero di prove è $n=3$, e che descive la probabilità di estrazione delle palline rosse perciò $p=5/10=1/2$ allora $X \sim \text{Bin}(3,1/2)$.

questo descrive completamente la distribuzione.

Il valore atteso: $E[X] = n*p = 3*1/2 = 3/2$

la varianza: $\text{Var}(X) = n*p*q= 3*1/2*(1-(1/2)) = 3/4$

2) identica descrizione, ma $Y$ è una ipergeometrica.

salvo svariano questo è tutto, se hai domande chiedi pure.

MasaOverflow
Effettivamente noto che usando la binomiale vengono fuori le prove che ho eseguito per verificare la probabilità degli eventi. Dunque mi conviene usare la binomiale e valutarla per il numero di successi che mi aspetto. Le ipergeometriche da quanto ho capito non rientrano nel corso, quindi ora che so della loro esistenza andrò a studiarle xD Grazie mille per il chiarimento!

MasaOverflow
Ti ringrazio per la dritta sulla distribuzione ipergeometrica, è veramente utile in casi come quelli sopraccitati mi è servita anche per altri esericizi, non capisco però perchè non la ha inclusa nel piano di studi...ad ogni modo volevo porti una piccola domanda...nel caso non posso associare nessuno schema noto posso vedere una variabile aleatoria come avevo detto per il caso di \(\displaystyle Y \)? Cioè data \(\displaystyle X \) variabile aleatoria allora la funzione di probabilità è \(\displaystyle \{p(x_1),...,p(x_n)\} \) con

\(\displaystyle p(x_n) = \) probabilità di ogni singolo elemento
\(\displaystyle x_n = \) elementi dello spazio campione

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.