Infiniti lanci di moneta

idlparsifal
Ho quest'esercizio che mi fa ammattire... Ho svolto i primi due punti, ma sull'ultimo proprio non ci arrivo, qualche hint?
Testo: Dopo aver a) costruito uno spazio di probabilità adeguato per l'esperimento di infiniti lanci di una moneta equa, calcolare:
b) la probabilità che la prima croce esca dopo un numero pari di teste
c) la probabilità che l'evento C-T-C avvenga prima dell'evento T-T-T

a) la costruzione è abbastanza facile: come spazio $Omega ={0,1}^N$, come semialgebra $J= {Omega, 0, J_(j_1, j_2, ..., j_k)}$
dove $j_i in {0,1}$ e $J_1$ è l'evento testa al primo lancio, $J_0$ è l'evento croce al primo lancio.
La funzione di probabilità è $P(J_(j_1, ... ,j_k) )= 2^(-k)$

b) Posso scrivere tale evento come unione: $J_{001} uu J_{00001} uu ... $
cioè l'unione per k da 1 ad infinito degli insiemi del tipo $J_(2k,1)$, dove si intende sequenze lunghe 2k di 0 e un 1 alla fine, che ha probabilità:
$P = sum_(1)^(oo) 2^(-2k-1) = 2 - 1/4 -1/2 -1 = 1/4$

c) Qui scriverei sempre l'evento come unione su x e y degli eventi $J_(x101y111)$ dove x e y sono sequenze di 0,1 tali che x non contiene né la sequenza 101 né quella 111, y non contiene la sequenza 111.
Qui mi blocco poi sul calcolo della probabilità...

Qualsiasi suggerimento è ben accetto!!!

Risposte
DajeForte
Be no mi pare che i risultati siano in linea con il valore teorico. Diciamo che gli ballano attorno mentre sono sistematicamente sopra 'altro.

fav = fav+1 giusto vedi io avevo inultimente creato un vettore.
Una cosa interessante è anche far diventare t un vettore e vedere che distribuzione assume.
Potresti anche farti ritornare tot/n per aver una idea di quante simulazioni sono andate bruciate, ovviamente intorno al vaore teorico.

Ma quanto ci mette il tuo computer a fare 1M di simulazioni su questo codice? Non lo ho provato ma penso che il mio si incagli per bene.

cenzo1
Ecco i tempi; tot/n è in linea con le attese:
> penneycond(1000000)
P(CTC|n>10) = 0.5939182 
P(n>10) = 0.086027 # = circa 88/1024
Time difference of 2.443483 mins # @notebook-intel-pentium-M-1.86GHz


"DajeForte":
Una cosa interessante è anche far diventare t un vettore e vedere che distribuzione assume.

Nel senso di analizzare le probabilità di vittoria di CTC su 3 lanci, su 4, su 5, ... ?
Se è così credo di poter modificare il codice che avevo scritto sull'analisi dell'albero (quindi risultati esatti, no simulazione)..


PS: mica ti sei perso questo ? :-D

DajeForte
No non me lo sono perso devo dire non lo ho neanche guardato troppo.
Diciamo che :mi fido di te! :-D

Si comunque intendevo sia quello che la probabilità che uno dei due esca alla n-esima.

Mi sono dimenticato: stai attento al grep a me una volta mi ha fregato di brutto.

Quello cerca caratteri: se hai f=c(123, 3, 343) e fai grep(3,f) ti da tutte e tre le posizioni perchè è in tutte e tre il 3. non prende il numero ma il carattere.
Per questo c'è match che ti ritorna la seconda pesozione perchè cerca il numero 3. Occhio al match anche ti ritorna il primo valore che trova. Vedi anche findInterval

Umby2
"cenzo":

Confermo. Sono appena arrivato allo stesso risultato.... (che sudata!)

In tal modo però, se non erro, la probabilità condizionata che CTC vinca su TTT, dato che su 10 lanci non c'è ancora nessun vincitore, sarebbe:



Siamo arrivati quasi insieme, a dire il vero io avevo già fatto una simulazione in excel, ed avendo notato in che modo le % cambiavano con il tempo, avevo formulato la domanda.

Parli di sudata, ma dimmi se hai usato anche te il metodo: n = n-1 + n-3 (... una specie di Fibonacci ... :-D )

Umby2
"cenzo":

Se è così credo di poter modificare il codice che avevo scritto sull'analisi dell'albero (quindi risultati esatti, no simulazione)..



Per i risultati esatti ho un foglio excel semplicissimo. Non mi andava scrivere codice, excel va ancora bene.



Questa tabella mostra le probabilità di vincita dal 3^ lancio in poi. Inizialmente i valori si discostano molto da 0,58333 e 0,41667 ( $7/12$ e $5/12$ ).

Al 20^ ci siamo quasi, mentre al 50^ i valori sono ormai stabilizzati.

E' evidente che la mia domanda precedente ( di non guardare i primi 10, ma di vedere dall'11^ in poi) eliminava una parte di dati, che influenzava il risultato finale.

cenzo1
"Umby":
Parli di sudata, ma dimmi se hai usato anche te il metodo: n = n-1 + n-3 (... una specie di Fibonacci ... :-D )

Sudata per calcolare le probabilità condizionate $P("CTC|CC")$ e le altre tre.
Avevo provato con le probabilità di transizione senza successo, quindi mi sono messo a programmare sull'albero.
Dopo che R ha confermato i risultati di Daje (con le martingale), la notte mi ha illuminato.. :-D

Avevo notato la sequenza tipo Fibonacci, era riportata anche qui (quinto rigo della tabella) insieme agli altri casi.. :wink:
Sono rimasto in R per due motivi: 1) poter analizzare qualunque caso, non solo CTC vs TTT (e magari anche con più di due giocatori);
2) migliorare ad usare R

Le tue domande hanno avuto risvolti molto interessanti, grazie! :)

Forse l'ultima domanda di Daje riguarda la probabilità che esca CTC (o TTT) per la prima volta al k-esimo lancio.
Cioè sarebbe curioso vedere se la distribuzione è simile ad una geometrica.

DajeForte
"Umby":
Parli di sudata, ma dimmi se hai usato anche te il metodo: n = n-1 + n-3 (... una specie di Fibonacci ... :-D )

Io ancora non me lo spiego bene il perchè di questo Fibonacci. Hai qualche idea da darmi?

@cenzo: si la domanda mia era quella e la risposta la sequenza di Umbinacci. :-D

Umby2
"DajeForte":

Diciamo che :mi fido di te! :-D



Io non mi fido !!!! :-D

Avevo già il foglio pronto, ho simulato anche dall' 11^ lancio, in poi. Ecco che appare il $157/264$ di Cenzo. Approvato. :wink:


Umby2
"cenzo":


Avevo notato la sequenza tipo Fibonacci, era riportata anche qui (quinto rigo della tabella) insieme agli altri casi.. :wink:


Avevi già postato questo link precedentemente, lo avevo anche visto, ma avevo focalizzato l'attenzione sul rigo 7/12 (odds), quello dove veniva riportato Tatami mats (.. che non mi diceva un granchè...), non avevo notato il rigo 5.
Comunque, penso che il risultato sia lo stesso di quell'articolo. A dire il vero non capisco perchè riporti due righi diversi (appunto quello citato da te, e quello citato da me), quando i risultati sono uguali ma opposti. :!:

Umby2
"DajeForte":

Io ancora non me lo spiego bene il perchè di questo Fibonacci. Hai qualche idea da darmi?

@cenzo: si la domanda mia era quella e la risposta la sequenza di Umbinacci. :-D


Direi il tutto si traduce a scoprire la sequenza delle uscite delle due combinazioni [CTC] e [TTT]. Era evidente che entrambe sequenze erano del tipo A(n) = A(n-1) - A(n-3).
Ma la [TTT] è sfasata di un gradino rispetto la [CTC]. Da qui nasce la % più bassa.

Detto ciò, il calcolo delle % è stato facile. Se puo' servire per una maggiore chiarezza riporto qui il foglio excel.

cenzo1
"Umby":
Io non mi fido !!!! :-D

Avevo già il foglio pronto, ho simulato anche dall' 11^ lancio, in poi. Ecco che appare il $157/264$ di Cenzo. Approvato. :wink:

"Fidarsi è bene, non fidarsi è meglio!" :-D

Spero non ti sia sfuggita la simulazione che avevo riportato qui. :-)

Una piccola nota: la tua non è una vera e propria simulazione, nel senso che non generi sequenze 10011001... random analizzando i risultati, ma si analizza l'albero a partire dagli 8 casi iniziali a profondità via via crescenti.
Il risultato che ottieni si avvicina a quello teorico esatto in modo certo più scendi in profondità nell'albero.
La simulazione invece sarà sempre ballerina attorno al valore teorico, e si fonda su un random number generator. :wink:

"Umby":
Avevi già postato questo link precedentemente, lo avevo anche visto, ma avevo focalizzato l'attenzione sul rigo 7/12 (odds), quello dove veniva riportato Tatami mats (.. che non mi diceva un granchè...), non avevo notato il rigo 5.
Comunque, penso che il risultato sia lo stesso di quell'articolo. A dire il vero non capisco perchè riporti due righi diversi (appunto quello citato da te, e quello citato da me), quando i risultati sono uguali ma opposti.

Si, avevo postato il link alla pagina di wiki, che poi segnalava nei riferimenti quell'altra.
Condivido in toto quello che dici.. pensa te.. ho iniziato a googlare "tatami mats".. ma in risposta avevo dei pavimenti! (non me ne vogliano i giapponesi!) :-D

Comunque bisognerebbe segnalare alla Wolfram che è inutile il loro codice per calcolare le probabilità, visto che con le martingale hai il risultato esatto in un batter d'occhio! :lol:

cenzo1
"DajeForte":
@cenzo: si la domanda mia era quella..

Cerco la probabilità che esca CTC per la prima volta al k-esimo lancio ($k>=3$)
Analizzando l'albero, si vede che i casi favorevoli sono la successione: 1,2,3,5,9,16,28,49,86,... ($a_{k}=a_{k-1}+a_{k-2}+a_{k-4}$)
I casi totali sono $2^k$

Per TTT i casi favorevoli sono la successione: 1,1,2,4,7,13,24,44,81,... ($a_{k}=a_{k-1}+a_{k-2}+a_{k-3}$)

Mi esce questa distribuzione, che richiama una geometrica, ma non lo è (le due curve partono dallo stesso punto iniziale $(3,1/8)$)



***
Ci ho provato a calcolare $P("CTC|CC")$ con le martingale.. ma nada.. ci rinuncio, non ha senso se non mi metto a studiare la teoria. :-)
Comunque, ho capito che sono uno strumento potente e con importanti applicazioni.
Grazie anche per le dritte sulle funzioni di R! Ciao :)

Umby2
"cenzo":


Spero non ti sia sfuggita la simulazione che avevo riportato qui. :-)

Una piccola nota: la tua non è una vera e propria simulazione, nel senso che non generi sequenze 10011001... random analizzando i risultati, ma si analizza l'albero a partire dagli 8 casi iniziali a profondità via via crescenti.


Assolutamente no, non mi è sfuggita.
Ho fatto il calcolo proprio per verificare il tuo dato ( confermato ). Proprio perchè tu avevi fatto una simulazione random (quindi contenente una % di errore).

"cenzo":


Il risultato che ottieni si avvicina a quello teorico esatto in modo certo più scendi in profondità nell'albero.
La simulazione invece sarà sempre ballerina attorno al valore teorico, e si fonda su un random number generator. :wink:



Esattamente.
Non so se hai dato una occhiata al foglio excel, è presente la colonna Non_CTC_TTT (rappresenta il residuo ancora da attribuire). Bene, questo dato al 100^ lancio è un numero piccolissimo 6E-14, significa che i valori calcolati sono precisi alla 13esima cifra decimale, molte di piu' di quante ne ho visualizzate.

Umby2
"cenzo":


I casi totali sono $2^k$



.... avrei qualche dubbio, vedi anche quello detto prima.
e se le % di uscita sono state calcolate su questa base ... :roll:

cenzo1
"Umby":
Assolutamente no, non mi è sfuggita.
Ho fatto il calcolo proprio per verificare il tuo dato ( confermato ). Proprio perchè tu avevi fatto una simulazione random (quindi contenente una % di errore).

Bene bene. Quindi non solo non ti fidavi del risultato teorico $157/264$, ma neanche della simulazione che mi avevi chiesto! :-D :-D

"Umby":
Esattamente.
Non so se hai dato una occhiata al foglio excel, è presente la colonna Non_CTC_TTT (rappresenta il residuo ancora da attribuire). Bene, questo dato al 100^ lancio è un numero piccolissimo 6E-14, significa che i valori calcolati sono precisi alla 13esima cifra decimale, molte di piu' di quante ne ho visualizzate.

:smt023

Faccio notare una cosa. Prendi ad esempio P(CTC) al lancio 5. Nella cella hai il valore $0.34375$.
Questo è dato dalla somma del precedente P(CTC) al lancio 4 più una quantità che hai calcolato come probabilità condizionata:
$3/18*0.5625=3/18*9/16=3/32=3/2^5=a_{k}/2^k$
Questo è evidente se pensi all'albero.. quindi potevi risparmiare alcune colonne del foglio Excel.

Spero che questo possa dissipare anche i tuoi dubbi successivi sul $2^k$.

Per chiarezza aggiungo che il grafico che ho riprodotto rappresenta la probabilità di uscita di CTC per la prima volta all'estrazione $k$.
Non tengo (volutamente) conto che TTT potrebbe anche essere già uscita. Non sto più ragionando su chi vince tra CTC e TTT.
Mi focalizzo solo su CTC e mi chiedo come è distribuita la variabile aleatoria "numero estrazione di prima uscita di CTC".
Deve poi ovviamente risultare $\sum_{k=3}^{+infty}P(k)=1$

cenzo1
"Umby":
.... avrei qualche dubbio, vedi anche quello detto prima.
e se le % di uscita sono state calcolate su questa base ... :roll:

Per togliermi anche io il dubbio ho sovrapposto la probabilità teorica calcolata come $a_{k}/2^k$ (vedi post precedenti)
con il risultato di una simulazione al crescere delle prove. Ne è uscita questa simpatica animazione:


Umby2
Ottimo l'ultimo grafico. Rende benissimo l'idea delle simulazioni.

Sulla formula che hai usato $2^k$ nessun dubbio. Il mio intervento si riferiva al fatto che tu parlavi di "casi totali".
Ovviamente quando esce un determinato evento, la sequenza termina.

cenzo1
Avevo ragionato così. Mi sono raffigurato l'albero. Primo estratto $2^1$ casi (T o C), secondo estratto $2^2$ casi (TT,TC,CT,CC), e così via, alla profondità k (k-esimo estratto) ho $2^k$ possibili sequenze diverse. Di queste $2^k$ ce ne sono $a_k$ che presentano CTC per la prima volta (cioè presentano la sequenza CTC esclusivamente in coda) . Da cui ho pensato di fare casi favorevoli su casi totali.

Umby2
:smt023

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.