Probabilità di completare un album di figurine
Salve! Mi sono posto un problema che non riesco ad affrontare. Vi chiedo una mano.
Il problema è il seguente:
Quante bustine occorre comperare (ogni bustina contiene 6 figurine) per avere una probabilità del 95% di completare un album di 734 figurine ?
Ho assunto le seguenti ipotesi:
- l'album è inizialmente vuoto;
- l'acquisto delle bustine avviene in una sola e unica occorrenza;
- non vi sono figurine "rare": ogni figurina ha eguale probabilità di far parte di una bustina;
- la bustina è composta estraendo a caso 6 figurine tra le 734, dunque è anche possibile che sia presente qualche "doppione" all'interno della bustina.
Ho iniziato a ragionare in tal modo:
1. Per calcolare il numero di bustine richiesto mi è sufficiente calcolare quante figurine occorrono e poi dividere per 6.
2. Per calcolare quante figurine occorrono per avere una probabilità P=0.95 di completare l'album si potrebbe immaginare di fissare il numero di figurine N (>734) e calcolare quanto vale la probabilità P(N) di completare l'album. Potrei poi ricavare N in funzione di P (da fissare pari a 0.95) come funzione inversa.
3. Fisso N>734. La probabilità di completare l'album con tali figurine corrisponde alla probabilità di avere 734 figurine diverse e le restanti N-734 come "doppioni". Credo sia opportuno utilizzare la definizione classica di probabilità come rapporto tra casi favorevoli e casi totali.
I casi totali sono $ 734^N $ (disposizioni con ripetizione, dato che ognuna delle N figurine estratte può appartenere ad una delle 734 diverse figurine).
Il problema è che non riesco ad enumerare in modo corretto i casi favorevoli.
Ho provato a ragionare anche su numeri più piccoli, cercando di rispondere al seguente problema equivalente:
Quanti lanci di un dado occorrono per avere una probabilità del 95% che escano tutte le 6 facce ?
Però mi blocco allo stesso punto.
Credete che il problema sia ben posto?
Suggerimenti per la risoluzione ?
Grazie mille!
cenzo
Il problema è il seguente:
Quante bustine occorre comperare (ogni bustina contiene 6 figurine) per avere una probabilità del 95% di completare un album di 734 figurine ?
Ho assunto le seguenti ipotesi:
- l'album è inizialmente vuoto;
- l'acquisto delle bustine avviene in una sola e unica occorrenza;
- non vi sono figurine "rare": ogni figurina ha eguale probabilità di far parte di una bustina;
- la bustina è composta estraendo a caso 6 figurine tra le 734, dunque è anche possibile che sia presente qualche "doppione" all'interno della bustina.
Ho iniziato a ragionare in tal modo:
1. Per calcolare il numero di bustine richiesto mi è sufficiente calcolare quante figurine occorrono e poi dividere per 6.
2. Per calcolare quante figurine occorrono per avere una probabilità P=0.95 di completare l'album si potrebbe immaginare di fissare il numero di figurine N (>734) e calcolare quanto vale la probabilità P(N) di completare l'album. Potrei poi ricavare N in funzione di P (da fissare pari a 0.95) come funzione inversa.
3. Fisso N>734. La probabilità di completare l'album con tali figurine corrisponde alla probabilità di avere 734 figurine diverse e le restanti N-734 come "doppioni". Credo sia opportuno utilizzare la definizione classica di probabilità come rapporto tra casi favorevoli e casi totali.
I casi totali sono $ 734^N $ (disposizioni con ripetizione, dato che ognuna delle N figurine estratte può appartenere ad una delle 734 diverse figurine).
Il problema è che non riesco ad enumerare in modo corretto i casi favorevoli.
Ho provato a ragionare anche su numeri più piccoli, cercando di rispondere al seguente problema equivalente:
Quanti lanci di un dado occorrono per avere una probabilità del 95% che escano tutte le 6 facce ?
Però mi blocco allo stesso punto.
Credete che il problema sia ben posto?
Suggerimenti per la risoluzione ?
Grazie mille!
cenzo
Risposte
"Sergio":
Direi che ci sono quasi
> gioco(6)\$p # si era ottenuto in altro modo 0.0154321 e... [1] 0.0154321 > gioco(7)\$p [1] 0.05401235 > gioco(8)\$p [1] 0.1140261 > gioco(9)\$p [1] 0.1890432
Per n=6 $P=frac{6!}{6^6}=0.0154321$ OK
Per n=7 io mi trovo $P=frac{10800}{6^7}=0.0385802$ e non $P=frac{15120}{6^7}=0.05401235$
Credo che il problema sia dovuto al fatto che stai considerando (anche Umby) tutte le combinazioni che contengono i 6 numeri su 7 lanci.
Ad esempio, la seguente combinazione: 1234561 non è da considerarsi tra gli eventi favorevoli, poichè realizza tutte e 6 le facce nei primi 6 lanci e non nei 7 lanci.
Come ha notato clrscr, occorre fissare all'ultimo lancio un numero che si presenta per la prima volta in tutta la sequenza, e che la completa.
Per n=7 io ho ragionato così: fisso il 6 per ultimo (o qualsiasi altro dei 6), metto ai primi 5 posti 12345, ottenendo la sequenza 12345x6
Il numero x può essere uno tra 1,2,3,4,5.
Se x fosse 1 avrei $P=frac{6!}{2!}$ modi di variare i primi 6 numeri della sequenza (fermo restando l'ultimo 6).
Se x fosse 2,3,4,5, avrei sempre lo stesso numero.
I casi favorevoli sono allora $6 cdot 5 cdot frac{6!}{2!}=10800$
Ragionando in modo analogo (ma le cose si complicano..) per più lanci ho ottenuto questi risultati (coerenti con quelli della simulazione):
Lanci - Eventi favorevoli
6 - 720
7 - 10800
8 - 100800
9 - 756000
10 - 5004720
11 - 30618000
Formule analitiche non riesco a costruirne, è troppo complicato per me.
Mi sembra però che la soluzione sia più vicina.
"cenzo":
Per n=6 risulterebbe che i numeri "senza tutte le cifre" dovrebbero essere quindi $6*5^n-14*4^n-20*3^n-15*2^n-6=20860$
e quindi i casi favorevoli essere $6^6-20680=25796$
Ciò però non è corretto in quanto con n=6 i casi favorevoli sono 6!=720
Con n=6 ti uscirebbe una probabilità molto alta, pari a 0.55
Con n=7 addirittura diminuirebbe la probabilità (a 0.31)
Scusate, ma se mi incaponisco e faccio tardi la notte, poi è naturale faccia errori scemi. E' l'età, spiacente

Comunque il mio ragionamento mi sembra giusto, devo solo correggere i calcoli e la formula (è sbagliata). Allora, la formula corretta per calcolare il "numero di disposizioni di 6 numeri in $n$ che NON comprendono tutti i numeri" è
$N=6*5^n-15*4^n+20*3^n-15*2^n+6$
Come già accennato, i numeri 6, 15, 20 ecc. sono i coefficienti binomiali. Verificare, se corretta applausi


Ovviamente si può estendere facilmente la f. al caso "figurine".
"Sergio":
...
Identici ai tuoi. Problema:
> gioco2(27) \$cnt [1] 8.805741e+18 \$p [1] 0.008603639
Un problema di codice? Mi farebbe piacere se gli dessi un'occhiata.
Non credo ci sia nessun problema. Devi solo fare la probabilità cumulata.
Cioè per avere 0.95 dovresti sommare le probabilità fino al 27-esimo lancio.
"Sergio":
Non so se l'hai notato, ma la tua formula dà esattamente gli stessi risultati della mia. In compenso la tua è decisamente più sintetica.
Spiego l'intero procedimento, così potete verificare se vi torna. Fra l'altro, noto che i risultati di Umby, per N che ho calcolato, sono identici ai miei, quindi anche lui ha trovato una formula simile (uguale?) alla mia.
Di sei numeri 1..6 sto cercando il numero di permutazioni differenti, di $n$ elementi, che non contengono tutti gli elementi. Le permutazioni totali sono ovviamente $6^n$.
Le disposizioni (d'ora in poi: gruppi) con un solo numero sono $((6),(1))=6$ differenti, ognuna dà luogo ad una sola permutazione: 111.. 222.. 333.. 444.. 555.. 666..
I gruppi di due numeri sono $((6),(2))=15$, ognuno dà luogo a $2^n$ permutazioni: 12.. 13.. 14.. 15.. 16.. 23.. 24.. 25.. 26.. 34.. 35.. 36.. 45.. 46.. 56..
Continuando così trovo $((6),(3))=20$ gruppi di tre numeri ognuno di $3^n$ permutazioni, $((6),(4))=15$ gruppi di quattro numeri ognuno di $4^n$ permutazioni e $((6),(5))=6$ gruppi di cinque numeri ognuno di $5^n$ permutazioni. L'ho fatta "blablabla" solo per illustrare il procedimento.
Ora, se ci fate caso i gruppi di cinque numeri "comprendono" anche i precedenti, e così via. Per esempio, la permutazione dei numeri 12345 in $n$ "genera" 1234512345432154.. ma anche 123412341234.. 121212.. Quindi devo "togliere i doppioni". Vediamo quanti sono:
- le disposizioni del gruppo 12345 in quattro numeri sono 1234 - 1235 - 1245 - 1345 -2345 ecc..
- le disposizioni del gruppo 12346 in quattro numeri sono 1234 - 1236 - 1246 - 1346 -2346 ecc..
che sono esattamente $2*((6),(4))$ (magia!). Infatti le disposizioni si ripetono (nell'esempio sopra, "1234" c'è due volte). Quindi nei gruppi di cinque numeri si contano due volte i gruppi di quattro numeri, e quindi tolgo un conteggio di questi. Finora ho:
$N=6*5^n - 15*4^n$
Ma c'è un problema: poiché nei gruppi di quattro elementi ($15*4^n$) sono compresi ANCHE quelli di tre elementi e così via, sempre esattamente due volte, vuol dire che gli elementi di questi li ho tolti due volte... quindi ce li devo rimettere:
$N=6*5^n - 15*4^n + 20*3^n$
E ancora, sono troppi perché i gruppi di tre contengono due volte i gruppi di due, e devo sottrarli. E così via fino ad arrivare alla formula finale:
$N=((6),(5))*5^n-((6),(4))*4^n+((6),(3))*3^n-((6),(2))*2^n+((6),(1))*1^n$
La formula è - direi - di uso generale (posso usarla per il problema dell'album di figurine e simili). Magari si può provare a adattarla ad altri casi semplici che siano calcolabili, per vedere se ho fatto str(void). Attendo commenti.
"Sergio":
Vero!
Ma allora la soluzione precedente (quella che dà gli stessi risultati di quella di Rggb) non è sbagliata, è solo un altro modo di affrontare il problema: [tex]\texttt{gioco()}[/tex] e [tex]\texttt{rggb()}[/tex] consentono di costruire la funzione di ripartizione; [tex]\texttt{gioco2()}[/tex], che è basata sul tuo approccio, dà la funzione di massa di probabilità.
Si, è proprio così! Ci avevo pensato anche io, ma avevo fatto il controllo sulla somma degli eventi favorevoli (e non mi tovavo) inveche che sulle probabilità (che stupido!). Ora i conti tornano. Inoltre la funzione di ripartizione è evidentemente molto più utile.
Il fatto che in entrambi i casi venissero 27 lanci non poteva essere un caso

"Sergio":
Si possono anche tracciare i grafici delle due funzioni:
> p <- 0; for (i in 2:60) p[i] <- gioco2(i)\$p > r <- 0; for (i in 2:60) r[i] <- rggb(i)\$p > png(filename="dadi.png", width=480, height=240, pointsize=8) > par(mfrow=c(1,2)) > plot(p, type="h", xlab="n", ylab="P(n)") > plot(r, type="l", xlab="n", ylab="F(n)") > dev.off()
Tutto torna: sono grafici del tutto simili a quelli che ho ottenuto plottando i risultati della mia simulazione.
"Sergio":
Rimane da capire bene (almeno per me) perché sia così, ma che sia così sembra un "fatto".
Dico "sembra" perché ho ancora il dubbio che ci sia qualcosa di fondato nella tua obiezione, ma sarebbe troppo lungo spiegare perché. Proverò prima a esaminare la soluzione di Rggb (equivalente alla mia, ma maledettamente più semplice).
Sono convinto che se trovassimo una espressione analitica della funzione massa di probabilità (in base alla mia interpretazione del problema-intendo la mia obiezione, che fonda la mia simulazione), e poi una espressione analitica per la somma delle masse di probabilità, otterremmo la stessa formula di Rggb. Il perchè comunque non saprei spiegarlo.
Complimenti e sonori applausi ad Rggb!!!
Grazie a tutti per il vostro contributo e il vostro tempo.
Adesso mi devo sforzare di capire il ragionamento di Rggb..

Ciao!
"Rggb":
Spiego l'intero procedimento, così potete verificare se vi torna. Fra l'altro, noto che i risultati di Umby, per N che ho calcolato, sono identici ai miei, quindi anche lui ha trovato una formula simile (uguale?) alla mia.
E' esattamente la stessa che avevo trovato, ma la cosa curiosa è che ho seguito lo stesso tuo ragionamento per trovarla.
Inizialmente non ero convintissimo della bonta' della stessa, ma poi confrontando i dati con quelli elaborati da Sergio, che aveva percorso una strada diversa, avevo notato che erano gli stessi (le percentuali coincidevano fino all'ultimo decimale...)
Ricordiamoci che questa formula riguarda il dado a 6 facce, mentre il nostro dado (album) ne contiene molte di piu'. Pero' a questo punto, forte anche del tuo appoggio, direi che si potrebbe generalizzare la stessa in questo modo:
D = Numero delle facce del dado
N = Numero delle prove
X = Numero di disposizioni complete di tutte le facce
$X = \sum_{k=1}^D (-1)^k * ((D),(k)) * (D-k)^N$
ottimi i grafici di Sergio, che rendono meglio di qualsiasi altro numero.
"Umby":
E' esattamente la stessa che avevo trovato, ma la cosa curiosa è che ho seguito lo stesso tuo ragionamento per trovarla.
Visti i numeri l'avevo sospettato, bbravo guagliò

Inizialmente non ero convintissimo della bonta' della stessa
io ero sicuro mi mancasse solo un dettaglio ma ero convinto del ragionamento, continuavo a togliere i dai gruppi di 5 tutti i gruppi inferiori e mi dicevo "..ma come, viene negativo?!?"
Pero' a questo punto, forte anche del tuo appoggio, direi che si potrebbe generalizzare la stessa in questo modo:
D = Numero delle facce del dado
N = Numero delle prove
X = Numero di disposizioni complete di tutte le facce
$X = \sum_{k=1}^D (-1)^k * ((D),(k)) * (D-k)^N$
Perfetto.
Passiamo alle cose serie: cenzo, paghi in contanti o CC?

"Rggb":
Passiamo alle cose serie: cenzo, paghi in contanti o CC?
Ue'...

33 33 33 .... 1% ad Admin che ci ospita

"Rggb":
Passiamo alle cose serie: cenzo, paghi in contanti o CC?
Purtroppo le finanze in questo momento non me lo permettono.. però sarei molto lieto di offrirvi una pizza qui a Napoli (dove abito).
Estraiamo una pizzeria a sorte?

"Sergio":
Tanto per essere pignoli, $2^n$ non sono permutazioni ma disposizioni con ripetizione.
Giusto.
Per eliminare i doppioni dovrei togliere 4 risultati per ogni numero da 1 a 6, cioè 24 risultati. Ma Rggb sembra toglierne solo 6.
Il ragionamento era un po' differente, "nei gruppi di 5 numeri si contano due volte i gruppi di quattro e così via". Però:
Se ho capito il suo ragionamento, a questo punto il conto sarebbe: $((6),(2))*2^7-((6),(1))*1^7=15*128-6*1=1920-6=1914$, ma il conto esatto è $1896$.
Ho capito male il tuo ragionamento, Rggb?
Hai capito perfettamente, ed hai trovato una falla. Quando ho verificato il passaggio ho contato "due volte" e mi sembrava ad occhio una regola generale, che non ho verificato - mea culpa

Fortunatamente si può rimediare, poiché basta contare quante effettivamente sono:
- I gruppi di quattro si ripetono due volte nei gruppi di cinque
- I gruppi di tre si ripetono tre volte nei gruppi di quattro.
- I gruppi di due si ripetono quattro volte nei gruppi di tre.
- I gruppi (sic) di uno si ripetono cinque volte nei gruppi di due.
Questa dovrebbe essere la regola generale. Quindi, sempre per dado-sei:
$N=((6),(5))*5^n-1*((6),(4))*4^n+2*((6),(3))*3^n-3*((6),(2))*2^n+4*((6),(1))$
Anche questa mi sembra facilmente generalizzabile. Sottopongo a verifiche per - oramai mi sono abituato - probabile gogna

PS. Ovviamente il calcolo per $n$ tale che $P=N/T$, con $N$ di cui sopra, $T=6^n$ e $P<=0.05$ cambiava non significativamente per la sequenza dado-sei. Ma per le figurine si sarebbe notata la differenza...
/OT
Dove diavolo è finito il msg di Sergio?
TO/
Dove diavolo è finito il msg di Sergio?
TO/
"Sergio":
Il conteggio "manuale" conferma che l'approccio di cenzo risponde correttamente alla domanda: "di quanti lanci ho bisogno perché, una volta che siano usciti 5 numeri nei primi $n-1$ lanci, esca il sesto all'$n$-esimo?", mentre i nostri rispondono correttamente alla domanda: "di quanti lanci ho bisogno perché escano, in un ordine qualsiasi, tutti e 6 i numeri?".
Accettare i 6 numeri in ordine qualsiasi significherebbe che io continuo ad acquistare figurine nonostante abbia già completato l'album in precedenza, vi pare? Invece io continuo ad acquistare figurine fintanto che me ne manca ancora qualcuna, e smetto non appena completo l'album, ovvero quando mi esce, per ultima, e per la prima volta, la figurina mancante. Con questo voglio solo osservare che il suddetto ragionamento, in definitiva suggerito dal post di clrscr, mi sembra più aderente al comportamento reale del collezionista di figurine

"Sergio":
definire una variabile aleatoria e le relative funzioni di massa di probabilità e di ripartizione.
La prima formula di Rggb funziona meravigliosamente bene come funzione di ripartizione nella mia interpretazione del problema:
$F_n = sum_{k = 6}^n P_k = 1 - frac{((6),(5))*5^n-((6),(4))*4^n+((6),(3))*3^n-((6),(2))*2^n+((6),(1))*1^n}{6^n}$
Pertanto la assumo come buona.
Tenendo conto che $P_n=F_n-F_(n-1)$, con semplici passaggi ho ottenuto la funziona massa di probabilità:
$P_n = frac{1*((6),(5))*5^(n-1)-2*((6),(4))*4^(n-1)+3*((6),(3))*3^(n-1)-4*((6),(2))*2^(n-1)+5*((6),(1))*1^(n-1)}{6^n}$
Ciò significa che il numeratore della formula qui sopra rappresenta il numero di casi favorevoli (sempre nella mia interpretazione del problema).
Mi piacerebbe capire come si ottiene questa formula "contando" i casi favorevoli...
Noto anche una certa somiglianza con la seconda formula di Rggb...
Dalle due formule ottengo esattamente gli stessi risultati che avevo ottenuto a mano:
lanci - casi favorevoli - PMF - CDF
6 720 0,0154321 0,0154321
7 10800 0,0385802 0,0540123
8 100800 0,0600137 0,1140261
9 756000 0,0750171 0,1890432
10 5004720 0,0827689 0,2718121
11 30618000 0,0843943 0,3562064
12 177645600 0,0816093 0,4378157
"Rggb":
Fortunatamente si può rimediare, poiché basta contare quante effettivamente sono:
...
Questa dovrebbe essere la regola generale. Quindi, sempre per dado-sei:
$N=((6),(5))*5^n-1*((6),(4))*4^n+2*((6),(3))*3^n-3*((6),(2))*2^n+4*((6),(1))$
Anche questa mi sembra facilmente generalizzabile. Sottopongo a verifiche per - oramai mi sono abituato - probabile gogna
Applicando tale formula per n=6 e n=7 mi escono probabilità negative.
Eppure per n crescente si ottengono probabilità che convergono ai valori che ci aspettiamo.
Sto rivedendo il procedimento, esclusivamente analitico e basato sul metodo del contare, poiché in entrambi i casi c'è qualcosa che mi sfugge:
- l'obiezione che aveva postato Sergio, anche se cancellata, mi pare pertinente visto che ricontando mi torna il suo ragionamento;
- modificando la f. con il nuovo ragionamento viene un risultato impossibile per n=6, 7 e quindi forse è sbagliata, o è sbagliato il procedimento di costruzione, o si basa su presupposto erroneo.
"Work in progress"
- l'obiezione che aveva postato Sergio, anche se cancellata, mi pare pertinente visto che ricontando mi torna il suo ragionamento;
- modificando la f. con il nuovo ragionamento viene un risultato impossibile per n=6, 7 e quindi forse è sbagliata, o è sbagliato il procedimento di costruzione, o si basa su presupposto erroneo.
"Work in progress"
"Sergio":
[quote="cenzo"]Accettare i 6 numeri in ordine qualsiasi significherebbe che io continuo ad acquistare figurine nonostante abbia già completato l'album in precedenza, vi pare?
Veramente no

Sto riflettendo sulla tua osservazione. Quindi tu dici che, per esempio nel caso di $n=7$ lanci, l'evento 1234561 è da considerarsi tra i casi favorevoli perchè comunque consente di completare la sequenza. Ho capito bene ?
Penso che ciò sia corretto nel caso io acquistassi tutte le figurine in un unico blocco, per così dire "alla cieca".
In realtà io le figurine le acquisto un po' per volta, diciamo -al limite- una per volta. In tale caso ho il controllo della situazione, cioè conosco gli esiti di ciò che è successo in precedenza, prima ancora di acquistare altre figurine. E' come se dovessi applicare una probabilità condizionata. Lancio ancora il dado, condizionatamente al fatto che non ho ancora completato la sequenza.
Il caso di de Mèrè che hai richiamato non mi sembra perciò confrontabile con questa situazione. O sbaglio ?
PS
"Sergio":
Torniamo ad un caso molto semplice, il problema di De Méré: qual è la probabilità di ottenere un 6 in quattro lanci?
Sappiamo da qualche secolo che la soluzione si basa sul calcolo della probabilità di non ottenere un 6 in quattro lanci, che è $(5/6)^4$.
Il complemento di questa è: ottengo un 6 in uno qualsiasi dei 4 lanci, non nel quarto.
Per la precisione, il cavaliere de Méré chiedeva qual è la probabilità di ottenere almeno un 6 in quattro lanci.

"cenzo":
Dalle due formule ottengo esattamente gli stessi risultati che avevo ottenuto a mano:
lanci - casi favorevoli - PMF - CDF
6 720 0,0154321 0,0154321
7 10800 0,0385802 0,0540123
8 100800 0,0600137 0,1140261
9 756000 0,0750171 0,1890432
10 5004720 0,0827689 0,2718121
11 30618000 0,0843943 0,3562064
12 177645600 0,0816093 0,4378157
C'e' un punto non chiaro nel tuo ragionamento.
Se ho ben capito, tu dici:
Se escono dopo sei lanci tutte le 6 facce, è inutile che prosegua perchè ho già "completato l'album".
Pertanto se tiri la settima volta il dado calcoli solo e solamente 10.800 (anzichè 15.120), ovvero solo quelle dove si è concretizzato l'evento "completo l'album" al settimo lancio.
Successivamente, pero' nel conteggio delle percentuali del settimo lancio metti al denominatore $6^7$, cosa discutibile, in quanto il denominatore dovrebbe essere:
$(6^6 - 720) * 6 = 275616$
questo proprio perchè tu tirerai solo se hai l'album incompleto.
Che ne pensi ?
"Sergio":
[quote="cenzo"]Mi piacerebbe capire come si ottiene questa formula "contando" i casi favorevoli...
Era il mio approccio. Dovrei lavorarci un po' per definire la formula, ma, visto che hai familiarità con R, ti posso far "toccare con mano" il conto.
...[/quote]
Grazie Sergio, questo mi è chiaro. E' praticamente lo stesso approccio che ho usato anche io per calcolare a "mano" gli eventi favorevoli, come ho indicato in questo post precedente. Ovviamente mi riferisco sempre al mio approccio (in cui l'ultimo numero compare per la prima volta).
Nel caso $n=10$ mi risultava:
$"Eventi favorevoli"=6*9!*(5/(5!)+20/(4!2!)+10/(3!3!)+30/(3!2!2!)+5/(2!2!2!2!))=5004720$
"cenzo":
Mi piacerebbe capire come si ottiene questa formula "contando" i casi favorevoli...
Mi riferivo alla formula di Rggb (molto più comoda di quella precedente dato che non si è riusciti a generalizzarla) che fornisce gli stessi risultati:
$"Eventi favorevoli"= 1*((6),(5))*5^(n-1)-2*((6),(4))*4^(n-1)+3*((6),(3))*3^(n-1)-4*((6),(2))*2^(n-1)+5*((6),(1))*1^(n-1)$
che per $n=10$ fornisce lo stesso risultato 5004720
Non ho compreso come esce questa formula, cioè qual è il ragionamento in termini di calcolo combinatorio.
"Umby":
[quote="cenzo"]
Dalle due formule ottengo esattamente gli stessi risultati che avevo ottenuto a mano:
lanci - casi favorevoli - PMF - CDF
6 720 0,0154321 0,0154321
7 10800 0,0385802 0,0540123
8 100800 0,0600137 0,1140261
9 756000 0,0750171 0,1890432
10 5004720 0,0827689 0,2718121
11 30618000 0,0843943 0,3562064
12 177645600 0,0816093 0,4378157
C'e' un punto non chiaro nel tuo ragionamento.
Se ho ben capito, tu dici:
Se escono dopo sei lanci tutte le 6 facce, è inutile che prosegua perchè ho già "completato l'album".
Pertanto se tiri la settima volta il dado calcoli solo e solamente 10.800 (anzichè 15.120), ovvero solo quelle dove si è concretizzato l'evento "completo l'album" al settimo lancio.
Successivamente, pero' nel conteggio delle percentuali del settimo lancio metti al denominatore $6^7$, cosa discutibile, in quanto il denominatore dovrebbe essere:
$(6^6 - 720) * 6 = 275616$
questo proprio perchè tu tirerai solo se hai l'album incompleto.
Che ne pensi ?[/quote]
La tua osservazione mi sembra giusta. Forse è la domanda chiave.
Vediamo se riesco a rispondere.
$P("completo album in esattamente 7 lanci")=P("completo album al 7° lancio / non l’ho completato in 6 lanci")*P("non completo l’album in 6 lanci")$
$P("non completo l’album in 6 lanci")=(6^6-6!)/6^6$
$P("completo album al 7° lancio / non l’ho completato in 6 lanci")=P("ho 5 facce diverse nei primi 6 lanci")*P("esce la faccia mancante al 7° lancio")$
$P("esce la faccia mancante al 7° lancio")=1/6$
$P("ho 5 facce diverse nei primi 6 lanci")$ la calcolo come rapporto tra casi favorevoli e casi possibili.
I casi favorevoli sono $6*5*(6!)/(2!)$
I casi possibili, come tu mi hai fatto notare, sono $6^6-6!$ (dato che devo escludere i casi che completano la sequenza in 6 lanci).
Assemblando i vari pezzi, ottengo:
$P("completo album in esattamente 7 lanci")=(6^6-6!)/6^6*(6*5*(6!)/(2!))/(6^6-6!)*1/6=(15*6!)/6^7=10800/6^7=0.0385802$
Commetto qualche errore?
Del resto mi sento “confortato” dai risultati della mia simulazione. Su 100000 prove ho ottenuto per 3844 volte che ho completato la sequenza al 7° lancio. Quindi ho un valore approssimato di $P(7)=0.03844$ molto vicino al valore teorico 0.0385802.
Se facessi $15120/6^7$ (è così che dici di fare?) otterrei 0.0540123 che sarebbe troppo elevato.
Invece: $P(6)+P(7)=720/6^6+10800/6^7=15120/6^7=0.0540123$
Qui compare 15120. Ma questa è la probabilità cumulata. Cioè è la probabilità di completare la sequenza in al più 7 lanci.
Quindi $P(6)=720/6^6$, $P(7)=10800/6^7$, $P(X<=7)=P(6)+P(7)=15120/6^7$
Mi sembra però che questo lo avevamo già appurato in precedenza (post di Sergio). Una è la funzione massa di probabilità. L'altra quella di ripartizone. Cosa c'è che non torna ?
"cenzo":
Assemblando i vari pezzi, ottengo:
$P("completo album in esattamente 7 lanci")=(6^6-6!)/6^6*(6*5*(6!)/(2!))/(6^6-6!)*1/6=(15*6!)/6^7=10800/6^7=0.0385802$
Commetto qualche errore?
Per quanto riguarda la percentuale 0,054123 dici che è troppo alta, ma questa rappresenta la % di completare l'album in 6 oppure 7 lanci. Lo dici tu stesso alla fine del tuo ragionamento. Rappresenta come detto da Sergio precedentemente la % (a priori).
Secondo me, c'e' ancora qualcosa di sbagliato nel tuo ragionamento.
Provo a spiegarmi:
Quello che a me non piace nella tua formula:
è il primo pezzo, che andrebbe eliminato del tutto.
Perchè ?
Perche nella seconda parte calcoli $P" 5 facce"$, e questa di per se contiene già il fatto che NON hai fatto il 6, ma solo e solamente 5. In altre parole è come se tu mettessi 2 volte la stessa cosa.
Pertanto (IMHO):
$P("completo album in esattamente 7 lanci")=(6*5*(6!)/(2!))/(6^6-6!)*1/6=10800/(6^6-6!)=0.0391...$
"cenzo":
Del resto mi sento “confortato” dai risultati della mia simulazione. Su 100000 prove ho ottenuto per 3844 volte che ho completato la sequenza al 7° lancio. Quindi ho un valore approssimato di $P(7)=0.03844$ molto vicino al valore teorico 0.0385802.
Come vedi, la mia % non differisce di molto dalla tua. Ma questa differenza da me riscontrata, ma mano che vai avanti nei calcoli, si ingigantisce. Già al dodocesimo lancio, provoca una bella differenza...
"Umby":
Per quanto riguarda la percentuale 0,054123 dici che è troppo alta
Intendevo che è troppo alta per essere la probabilità di completare la sequenza in esattamente 7 lanci, che vale 0,0385802.
"Umby":
ma questa rappresenta la % di completare l'album in 6 oppure 7 lanci. Lo dici tu stesso alla fine del tuo ragionamento
Esatto
"Umby":
Secondo me, c'e' ancora qualcosa di sbagliato nel tuo ragionamento.
Provo a spiegarmi:
Quello che a me non piace nella tua formula:
è il primo pezzo, che andrebbe eliminato del tutto.
Perchè ?
Perche nella seconda parte calcoli P(5 facce), e questa di per se contiene già il fatto che NON hai fatto il 6, ma solo e solamente 5. In altre parole è come se tu mettessi 2 volte la stessa cosa.
Ho usato il teorema della probabilità assoluta:
$P(A)=P("A/B")*P(B)+P("A/B’")*P(B’)$
dove
A=completo la sequenza in esattamente 7 lanci
B=completo la sequenza in 6 lanci
Ovviamente P(A/B)=0. Infatti, dato che ho completato la sequenza al 6° lancio, allora non ho alcuna probabilità di completarla esattamente al 7°, visto che è già completa. Sono eventi incompatibili.
(del resto è questo che mi consente di sommarli per ottenere la funzione di ripartizione).
P(A/B’) è la probabilità condizionata di completare la sequenza in esattamente 7 lanci, dato che non ho completato la sequenza in 6 lanci. Quindi è ovvio che in questa probabilità condizionata DEVO assumere che non ho completato la sequenza in 6 lanci.
P(B’) è la probabilità di non completare la sequenza in 6 lanci e vale $(6^6-6!)/6^6$
Non è che io assumo due volte la stessa cosa. E’ il teorema della probabilità assoluta che mi costringe a farlo.
"Umby":
[quote="cenzo"]
Del resto mi sento “confortato” dai risultati della mia simulazione. Su 100000 prove ho ottenuto per 3844 volte che ho completato la sequenza al 7° lancio. Quindi ho un valore approssimato di $P(7)=0.03844$ molto vicino al valore teorico 0.0385802.
Come vedi, la mia % non differisce di molto dalla tua. Ma questa differenza da me riscontrata, ma mano che vai avanti nei calcoli, si ingigantisce. Già al dodocesimo lancio, provoca una bella differenza...[/quote]
Sempre con riferimento alla mia simulazione, su 100000 prove ho ottenuto per 8231 volte che ho completato la sequenza al 12° lancio. Quindi ho un valore approssimato di $P(12)=0.08231$ molto vicino al valore teorico $0.0816093= 177645600/6^12$.
Ribadisco che questa è la probabilità di completare la sequenza in esattamente 12 lanci.
La probabilità di completarla in al più 12 lanci (in 6 o in 7 o… o in 12) vale $P(6)+P(7)+…+P(12)=P(X<=12)=F(12)= 0.4378157$
Ovviamente per calcolare quanti lanci ci vogliono per avere una probabilità del 95% di completare la sequenza userei senz’altro la probabilità cumulata, cioè la F, concludendo 27 lanci.
Siamo perfettamente d’accordo che per rispondere al problema usiamo la F. di ripartizione.
La funzione massa di probabilità mi dice solo che la probabilità di completare la sequenza in esattamente 27 lanci è 0.0086036, mentre la probabilità di completarla in al più 27 lanci è 0.9565864.