Quesito probabilità

matematicoestinto
Ho letto questo quesito su un gioco di enigmistica e sto realizzando che è molto più difficile di quello che sembra.. Potete aiutarmi?

In un libro di 500 pagine ci sono 100 errori. Qual è la probabilità che ci siano 3 errori in una pagina?

Grazie

Risposte
frapippo1
Non so se questo ragionamento è corretto, ma io proverei così: supponiamo di avere 500 urne e 100 palline a disposizione, che devono essere lanciate in queste urne. Con certezza, effettuato un lancio, la relativa pallina cadrà in una delle 500 urne. La probabilità che questa pallina cada in una determinata urna (chiamiamola urna $k$) è 1/500. Se allora ripetiamo l'esperimento 100 volte, possiamo usare una distribuzione binomiale di parametri $n=100$ e $p=1/500$. Così la probabilità che nell'urna (=pagina) $k$ ci siano 3 palline (=errori) è: \[\binom{100}{3}p^3(1-p)^{97}\]

matematicoestinto
Non capisco perchè è quella li la soluzione.. potresti spiegarmi meglio come ci sei arrivato? Potresti spiegarmi tutti i fattori?

GRazie...

Faussone
Non ho capito se si chiede qual è la probabilità che esaminando una pagina qualunque trovo 3 errori o se si chiede qual è la probabilità che esaminando tutte le 500 pagine ne trovo una con 3 errori. Credo sia più la prima ipotesi, ma non ne sono sicuro.
In tal caso (prima ipotesi) concordo con la risposta di frapippo riguardo alla conversione dell'esperimento nelle 500 urne e 100 lanci di palline, ma non concordo con lui sul fatto che la probabilità sia espressa dalla distribuzione binomiale, che non mi pare calzante in questo scenario.

Propendo più per la distribuzione di Poisson che mi dice dato un evento che accade con frequenza $f$ (pari ad $1/500$ in questo caso) qual è la probabilità che ripetendolo $N$ volte (100 nel nostro caso) esso accada $k$ volte (3 in questo caso).

La probabilità è secondo Poisson sarebbe $p=\frac{(fN)^k e ^(-fN)}{k!}=0,11$%

Supponiamo infatti di guardare una delle 500 urne (pagine) e vedere in 100 lanci (numero errori da distribuire) quale sia la probabilità che 3 palline, e solo 3, (cioè errori) tra le 100 lanciate cadano nell'urna (pagina) osservata.

frapippo1
Ciao..quella che scrivi al 5° e 6° rigo è esattamente la distribuzione binomiale di parametri $(N,f)$.
Una variabile aleatoria distribuita secondo una poissoniana ha come supporto l'insieme dei numeri naturali. In questo caso (fermo restando che l'interpretazione urne-palline sia corretta), il numero di successi (cioè palline imbucate in una determinata urna) varia fra 0 e 500. Calcolando la probabilità secondo la distribuzione binomiale \[\binom{100}{3}f^{3}(1-f)^{97}\simeq0.00106\] approssimativamente il tuo risultato (dove $f=1/500$). Ciò perché la distribuzione di poisson può essere vista come limite della distribuzione binomiale, per $N\rightarrowinfty$.

Per matematicoestinto: su un qualsiasi libro di statistica di base (o anche su internet) puoi trovare la spiegazione della distribuzione binomiale. Una volta capita, la formuletta è automatica.

Faussone
Hai ragione frapippo in questo caso pensandoci bene è più corretta la binomiale visto che parliamo di eventi discreti per cui la probabilità del singolo evento (centrare una certa urna) è maggiore di zero.
Quello che ho scritto io con Poisson è la probabilità che un evento che accade mediamente una volta ogni 500 minuti abbia probabilità di verificarsi 3 volte in 100 minuti, che è qualcosa di leggermente diverso.
Se supponiamo che venga lanciata una pallina ogni minuto (e ogni pallina finisca necessariamente in una tra 500 urne diverse) quello che ho calcolato io è la probabilità che guardando un urna per 100 minuti vedo 3 palline finirci dentro che è cosa leggermente diversa dalla probabilità che lanciando 100 palline ognuna che finisce in una tra 500 urne, osservando un urna alla fine vedo dentro solo 3 palline...

EDIT
Se invece il problema chiedesse la probabilità che ci sia almeno una pagina con soli 3 errori quale sarebbe la soluzione?
Non ci ho ancora pensato, a prima vista non mi sembra facile estendere il risultato della binomiale però...

frapippo1
Prima di abbozzare una risposta alla tua domanda vorrei sottolineare una cosa. Quella che abbiamo calcolato è la probabilità che scelta una determinata pagina (per esempio la decima), in questa ci siano esattamente tre errori, che differisce dalla probabilità che la pagina scelta sia l'unica contenente tre errori.

Premesso questo, possiamo provare ad estendere il ragionamento. Scegliamo una pagina (per esempio la decima) e calcoliamo la probabilità che questa abbia tre errori (distribuzione binomiale).

Scegliamo due pagine (per esempio la decima e la ventesima) e calcoliamo la probabilità che ciascuna di esse contenga tre errori (il che, ribadisco, non vuol dire che queste due pagine siano le sole a contenere tre errori). In tal caso, ci viene in soccorso la distribuzione multinomiale (estensione della binomiale): sia $f_1$ la probabilità di un errore nella decima pagina e $f_2$ quella di un errore nella ventesima, dove $f_1=f_2=1/500$. Allora denotato con $A$ l'evento "tre errori nella decima e ventesima pagina" avremo \[P(A)=\frac{100!}{3!3!94!}f_1^3f_2^3(1-f_1-f_2)^{94}\].

Scegliamo tre pagine (decima, ventesima e novantacinquesima) e calcoliamo la probabilità che ciascuna di esse contenga tre errori (ancora distr. multinomiale).
.
.
.
Scegliamo 33 pagine e calcoliamo la probabilità che ciascuna di esse contenga tre errori (distrib. multinomiale)

Sommiamo queste 33 probabilità e otteniamo la probabilità che almeno in una delle pagine selezionate ci siano 3 errori.

Faussone
"frapippo":
Prima di abbozzare una risposta alla tua domanda vorrei sottolineare una cosa. Quella che abbiamo calcolato è la probabilità che scelta una determinata pagina (per esempio la decima), in questa ci siano esattamente tre errori, che differisce dalla probabilità che la pagina scelta sia l'unica contenente tre errori.

Sì qui ci sono, infatti è proprio quello che avevo detto nel primo messaggio.


"frapippo":

Scegliamo due pagine (per esempio la decima e la ventesima) [...]


E' vero! Mi torna questo ragionamento e anche se non è così complesso non ci sarei arrivato subito da solo!

Grazie! :-)

PS: A discolpa della mia lentezza devo dire che questi argomenti provo a studiarli da me a tempo perso (mi divertono molto) mi manca quindi l'esperienza che permette di vedere le cose subito. E' un peccato che nei miei studi universitari non abbia avuto occasione di seguire alcun corso di statistica :-(

DajeForte
@frapippo: ciao; io non sono riuscito a capire che ragionamento hai fatto, ma non mi sembra sia corretto.

Se chiami $A_i="la pg. i contiene esattamente 3 errori"$.

L'evento che dici è $A=uu_{i=1}^(33) A_i$ (considero, per semplicità, che scegliamo le prime 33 pagine)

ma non mi pare risulti $P(A)=sum_{i=1}^{33}P(nn_{j=1}^i A_j)$.

è questo il ragionamento che hai fatto?

Faussone
Un attimo... ho frainteso la distribuzione multinomiale forse: mi viene un dubbio (forse il medesimo di DajeForte?).
Si chiedeva (o meglio chiedevo io :-) ) quale sia la probabilità che dato un libro con 500 pagine e con 100 errori, ci sia almeno una pagina con (solo esattamente) 3 errori. Tale probabilità è uguale alla probabilità che ci sia una sola pagina con 3 errori più la probabilità che ci siano due sole pagine con 3 errori ecc.... ....più la probabilità che ci siano solo 33 pagine (massimo possibile ) con soli 3 errori.
Il problema è che la distribuzione multinomiale calcola, da quello che ho capito, la probabilità che scegliendo n pagine a caso queste contengano ciascuna 3 errori e non la probabilità che in tutto ci siano solo n pagine con 3 errori.

frapippo1
"Faussone":

Il problema è che la distribuzione multinomiale calcola, da quello che ho capito, la probabilità che scegliendo n pagine a caso queste contengano ciascuna 3 errori e non la probabilità che in tutto ci siano solo n pagine con 3 errori.


Esatto..se tu volessi la probabilità che in tutto ci siano solo n pagine con 3 errori, penso che il problema si complicherebbe a dismisura.
"DajeForte":
@frapippo: ciao; io non sono riuscito a capire che ragionamento hai fatto, ma non mi sembra sia corretto.

Se chiami $A_i="la pg. i contiene esattamente 3 errori"$.

L'evento che dici è $A=uu_{i=1}^(33) A_i$ (considero, per semplicità, che scegliamo le prime 33 pagine)

ma non mi pare risulti $P(A)=sum_{i=1}^{33}P(nn_{j=1}^i A_j)$.

è questo il ragionamento che hai fatto?


Si ho fatto questo ragionamento..ma ora mi stanno sorgendo dei dubbi..

Faussone
Insomma come pensavo la domanda non è così facile.
Come ordine di grandezza in effetti la probabilità non dovrebbe essere troppo diversa da quella che si ottiene pensando di scegliere per 500 volte una pagina a caso da 500 diversi libri ciascuno con dentro 100 errori e calcolando la probabilità di beccare almeno da un libro una pagina con 3 errori. Questa si trova da quella calcolata prima (probabilità che prendendo una pagina a caso da un libro di 500 pagine contenete 100 errori, essa contenga 3 errori) tramite somma di binomiali: probabilità che solo in un libro becco una pagina con tre errori più probabilità che solo in 2 libri becco una pagina con 3 errori... più probabilità che solo in 500 libri becco una pagina con tre errori.
Però non è esattamente la risposta alla mia domanda credo... :-(

DajeForte
"Faussone":
Si chiedeva (o meglio chiedevo io :-) ) quale sia la probabilità che dato un libro con 500 pagine e con 100 errori, ci sia almeno una pagina con (solo esattamente) 3 errori. Tale probabilità è uguale alla probabilità che ci sia una sola pagina con 3 errori più la probabilità che ci siano due sole pagine con 3 errori ecc.... ....più la probabilità che ci siano solo 33 pagine (massimo possibile ) con soli 3 errori.


Si questa che dici è corretto ma conviene seguire una strada leggermente diferente:
(qua torna utile il discorso che faceva frapippo)

chiamo $X_i$ la v.a. che descrive il numero di errori nella pagina i (per i=1,...,500)

L'evento che vuoi trovare è $A=bigcup_{i=1}^{500}(X_i=3)$

Dal principio di inclusione/esclusione si ha che:

$P(A)=$

$sum_i P(X_i=3)-sum_{i,j}P(X_i=3,X_j=3)+sum_{i,j,k}P(X_i=3,X_j=3,X_k=3)+...-P(X_1=3,...,X_500=3)$

Un po' di precisazioni:
1) le somme sono estese a tutte le possibili combinazioni di scelta delle v.a. ad esempio la terza somma si comporrà di $((500),(3))$ addendi;
2) la distribuzione di $(X_{j_1},...,X_{j_k})$ sono multinomiali e quindi ogni addendo all'interno delle singole somme è uguale;
3) le probabilità saranno 0 quando utilizzeremo più di 33 variabili.

Fatto questo con R ho fatto questi calcoli e mi viene un risultato di 0.419765.

Faussone
Grazie DajeForte, molto interessante.
Non ho ben chiaro come calcoli le varie sommatorie che costituiscono la probabilità finale (infatti non capisco bene cosa dici nel punto 2) , ma il discorso sembra filare di più ora. Proverò a pensarci un po'.

Comunque facendo il conto con l'esperimento di aprire una pagina a caso 500 volte da 500 libri siffatti, come descritto nel mio precedente messaggio, viene fuori che la probabilità di trovare almeno una volta una pagina con 3 errori è 0.413, in perfetto accordo con quanto da te trovato, mi aspettavo infatti che i due valori fossero vicini.

EDIT: Ho capito adesso i vari termini della sommatoria e mi torna il tuo risultato 0.4197.

DajeForte
@Faussone non ho capito che tipo di ragionamento hai fatto; lo potresti spiegare?

Il punto 2) dice che comunque scelte un gruppo di n variabili, la loro distribuzione è una multinomiale di dimensione n.

Faussone
Dicevo che, come ordine di grandezza, la probabilità di trovare 3 errori, in una pagina almeno, di un libro di 500 pagine che contiene 100 errori, dovrebbe essere pari alla probabilità di trovare, aprendo a caso una pagina da 500 libri di 500 pagine, ciascuno contenente 100 errori, almeno una pagina con 3 errori.
Trovare quest'ultima è facile sapendo la probabilità di trovare su una pagina aperta a caso di un tale libro 3 errori: basta sommare la probabilità di trovare i tre errori in una sola apertura delle 500, più la probabilità di trovare i tre errori in 2 sole aperture delle 500...... ...più la probabilità di trovare i tre errori in tutte e 500 le aperture.

Per il punto 2) sì ho capito il modo di procedere che hai usato, infatti ritrovo il tuo risultato.

frapippo1
Ciao ragazzi..concordo con il ragionamento di DajeForte, circa il principio di inclusione-esclusione. Un'unica precisazione, visto che sono andato a riguardarmi il teorema:
"DajeForte":


$P(A)=$

$sum_i P(X_i=3)-sum_{i,j}P(X_i=3,X_j=3)+sum_{i,j,k}P(X_i=3,X_j=3,X_k=3)+...-P(X_1=3,...,X_500=3)$

Un po' di precisazioni:
1) le somme sono estese a tutte le possibili combinazioni di scelta delle v.a. ad esempio la terza somma si comporrà di $((500),(3))$ addendi;


le sommatorie dovrebbero essere formulate in questo modo: per esempio per la seconda, $sum_{i

DajeForte
Bene visto che siamo tutti di accordo possiamo procedere con dei rilanci che mi sono venuti leggendo i vostri post e gli eventi che avete citato.

Calcolare le probabilità dei seguenti eventi:

1) scelto un gruppo di $n$ pagine, ce ne sia almeno una con esattamente 3 errori;
2) scelti due gruppi di n ed m pagine (senza pagine in comune), ce ne sia almeno una, nel primo gruppo, con esattamente 3 errori e nell'altro gruppo nessuna abbia esattamente 3 errori;
3) ci siano esattamente n pagine con 3 errori ciascuna.

Partiamo da questi.
P.S. non ho fatto nessun conto e dunque non so neanche se sia possibile calcolarle; pertanto oltre a soluzioni complete postate, se volete, anche soluzioni parziali o idee o dubbi.

Ciao.

frapippo1
Provo col primo.

Sia $h=1,..,((500),(n))$ l'indice che denota tutti i possibili sottogruppi di $n$ pagine. Sia $X_{i,h}$, $i=1,..,n$, la variabile aleatoria, che indica il numero di errori dell'i-esima pagina dell'h-esimo sottogruppo (per esempio se n=3, nel sottogruppo costituito dalle pagine 20,10,35, possiamo riordinare la numerazione in modo crescente e considerare $X_{1,h}$ la variabile aleatoria del numero di errori nella pagina 10, e così via).
Soffermiamoci per il momento su un particolare sottogruppo e chiamiamolo $h^{\star}$. La probabilità che almeno una pagina contenga 3 errori in questo sottogruppo è:

$P(bigcup_{i=1}^{n}(X_{i,h^{\star}}=3))=sum_{i=1}^{n}P(X_{i,h^{\star}}=3)-sum_{i=1}^{n}sum_{j $+(-1)^{n+1}P(X_{1,h^{\star}}=3,..,X_{n,h^{\star}}=3)$

La prima sommatoria contiene n elementi tutti uguali, per cui è data da $n((100),(3))(1/500)^3(499/500)^97$.
La seconda sommatoria è data da $((n),(2))frac{100!}{3!3!94!}(1/500)^3(1/500)^3(498/500)^94$
E così via. Chiaramente le probabilità calcolate sull'intersezione di un numero di eventi maggiori di 33 sono 0.

Adesso per calcolare la prob. che in un gruppo di n pagine, almeno 1 contenga 3 errori dobbiamo ripetere i calcoli per i possibili $((500),(n))$ gruppi. Siccome la probabilità per ciascun gruppo è la stessa, basta moltiplicare il risultato ottenuto due righe più su per $((500),(n))$.

Faussone
Per quanto riguarda il primo mi viene in mente un'idea (data l'ora è la mia scarsa esperienza non sono per niente sicuro che sia corretta, ma anche qui come prima approssimazione dovrebbe andare).
Il problema lo ricondurrei al caso già analizzato con la differenza che il libro ora ha $n$ pagine e gli errori totali sono $1/5 * n$.

EDIT: In effetti può andar bene solo come ordine di grandezza come si vede per $n<15$ che darebbe sempre zero...
Un'altra rozza stima forse è la probabilità calcolata prima moltiplicata per $n/500$.

DajeForte
"frapippo":
Soffermiamoci per il momento su un particolare sottogruppo e chiamiamolo $h^{\star}$. La probabilità che almeno una pagina contenga 3 errori in questo sottogruppo è:

$P(bigcup_{i=1}^{n}(X_{i,h^{\star}}=3))=sum_{i=1}^{n}P(X_{i,h^{\star}}=3)-sum_{i=1}^{n}sum_{j $+(-1)^{n+1}P(X_{1,h^{\star}}=3,..,X_{n,h^{\star}}=3)$

La prima sommatoria contiene n elementi tutti uguali, per cui è data da $n((100),(3))(1/500)^3(499/500)^97$.
La seconda sommatoria è data da $((n),(2))frac{100!}{3!3!94!}(1/500)^3(1/500)^3(498/500)^94$
E così via. Chiaramente le probabilità calcolate sull'intersezione di un numero di eventi maggiori di 33 sono 0.

Questo va bene ed è la proabilità che, fissate n pagine, ce ne sia almeno una con esattamente 3 errori.

"frapippo":
Adesso per calcolare la prob. che in un gruppo di n pagine, almeno 1 contenga 3 errori dobbiamo ripetere i calcoli per i possibili $((500),(n))$ gruppi. Siccome la probabilità per ciascun gruppo è la stessa, basta moltiplicare il risultato ottenuto due righe più su per $((500),(n))$.


Questo non mi torna; come giustifichi, eventualmente con una argomentazione di eventi, la somma sulle combinazioni?

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.