Esperimento: le quote medie sono le più vantaggiose?
[size=85]
Salve a tutti, vorrei proporvi un esperimento che ho effettuato al pc con l’aiuto del php e sarei molto grato se voleste commentarlo, magari aiutandomi a capire le leggi matematiche che sono alla base dell’esperimento di cui sotto. Come capirete sicuramente leggendo, le mie conoscenze matematiche sono quelle di un liceale.[/size]
Consideriamo 2 scommettitori che hanno un’abilità differente, chiamiamoli S1 ed S2: S2 indovina il 5% in più delle partite che indovina S1.
Quindi se un evento ha probabilità di successo = 0,50, allora P(S1) = 0,50 e P(S2) = 0,55.
S1 ed S2 scommettono su partite differenti quindi nel breve termine è lecito aspettarsi che ci sia una qualche probabilità che si possa “trovare avanti” S1. Nel lungo termine ovviamente si troverà avanti S2 avendo un 5% di margine su S1.
Consideriamo che gli eventi (E) su cui scommettono S1 e S2 hanno probabilità diverse di successo.
Ora la mia ipotesi è questa: “Se i giocatori scommettono su eventi avendo probabilità vicine al 50% di vittoria la probabilità che nel breve termine S1 abbia vinto più di S2 è maggiore che se gli eventi su cui scommettono avessero probabilità di vittoria o molto alte o molto basse”.
Di conseguenza ciò che ipotizzo è che nel breve termine la maggior bravura di S2 sia più facilemente evidenziabile se gli eventi abbiano o basse o alte probabilità di vittoria.
Iniziamo una simulazione al pc considerando n (numero di eventi) = 100, c (numeri di cicli) , m ( margine che S2 ha su S1) = 5%, P(S1) = 0% e P(S2) = 5%, le probabilità di vittoria di S1 ed S2 le faremo aumentare gradualmente per vedere come variano i loro risultati ai vari livelli di probabilità.
Iniziamo col considerare i primi 100 eventi ed al loro termine vediamo chi tra S1 ed S2 ha conseguito più vittorie. Se vince S1 aumentiamo di un’unità V1 ( counter delle vittorie di S1) altrimenti aumentiamo di un’unità V2. Ripetiamo questo ciclo per 1000 volte (c).
Una volta ripetuto il ciclo per 1000 volte riportiamo su un grafico V2 poi incrementiamo di un’unità sia P(S1)=1% che P(S2)=6%.
Continuiamo così fino a che P(S1) = 95% e P(S2)=100%.
I risultati sono riassunti nel grafico che segue, dove Serie 1, serie 2 e serie 3 sono rispettivamente esperimenti fatti variando il margine di S2 su S1, rispettivamente del 5% del 10% e del 20%.

Otteniamo delle curve a parabola con vertice nei pressi delle “probabilità centrali”, più accentuate quando il margine di S2 su S1 aumenta.
Ciò mi porterebbe a supporre che l’ipotesi da me formulata sia vera (dando per scontato che questa non vuole assolutamente proporsi come una dimostrazione seria bensì come semplice constatazione).
Se l’ipotesi fosse vera non sarebbe secondo voi lecito ad esempio preferire scommesse su eventi con probabilità media anziché su probabilità estreme?
Questa è solo una dei possibili utilizzi di questa teoria, ad esempio si avrebbe maggior certezza nel valutare uno scommettitore migliore di un altro nel breve periodo se questi abbiano scommesso su probabilità estreme anziché su probabilità medie.
Sarebbe interessante sapere quale sia la funzione di questa parabola in base alle variabili.
[size=85]PS.
Sono sicuro che comunque queste siano cose già note a tutti ed il mio è sicuramente stato un esperimento (passatemi il termine) o più che altro un passatempo che mi ha permesso di divertirmi qualche oretta. Mi dispiace solamente perché le mie conoscenze matematiche non sono in grado di soddisfare tutti i miei dubbi, ma non lo rimpiango dato che la mia scelta universitaria è stata tutt’altra.[/size]
Sono in attesa di vostri commenti!
Buona giornata a tutti.
Salve a tutti, vorrei proporvi un esperimento che ho effettuato al pc con l’aiuto del php e sarei molto grato se voleste commentarlo, magari aiutandomi a capire le leggi matematiche che sono alla base dell’esperimento di cui sotto. Come capirete sicuramente leggendo, le mie conoscenze matematiche sono quelle di un liceale.[/size]
Consideriamo 2 scommettitori che hanno un’abilità differente, chiamiamoli S1 ed S2: S2 indovina il 5% in più delle partite che indovina S1.
Quindi se un evento ha probabilità di successo = 0,50, allora P(S1) = 0,50 e P(S2) = 0,55.
S1 ed S2 scommettono su partite differenti quindi nel breve termine è lecito aspettarsi che ci sia una qualche probabilità che si possa “trovare avanti” S1. Nel lungo termine ovviamente si troverà avanti S2 avendo un 5% di margine su S1.
Consideriamo che gli eventi (E) su cui scommettono S1 e S2 hanno probabilità diverse di successo.
Ora la mia ipotesi è questa: “Se i giocatori scommettono su eventi avendo probabilità vicine al 50% di vittoria la probabilità che nel breve termine S1 abbia vinto più di S2 è maggiore che se gli eventi su cui scommettono avessero probabilità di vittoria o molto alte o molto basse”.
Di conseguenza ciò che ipotizzo è che nel breve termine la maggior bravura di S2 sia più facilemente evidenziabile se gli eventi abbiano o basse o alte probabilità di vittoria.
Iniziamo una simulazione al pc considerando n (numero di eventi) = 100, c (numeri di cicli) , m ( margine che S2 ha su S1) = 5%, P(S1) = 0% e P(S2) = 5%, le probabilità di vittoria di S1 ed S2 le faremo aumentare gradualmente per vedere come variano i loro risultati ai vari livelli di probabilità.
Iniziamo col considerare i primi 100 eventi ed al loro termine vediamo chi tra S1 ed S2 ha conseguito più vittorie. Se vince S1 aumentiamo di un’unità V1 ( counter delle vittorie di S1) altrimenti aumentiamo di un’unità V2. Ripetiamo questo ciclo per 1000 volte (c).
Una volta ripetuto il ciclo per 1000 volte riportiamo su un grafico V2 poi incrementiamo di un’unità sia P(S1)=1% che P(S2)=6%.
Continuiamo così fino a che P(S1) = 95% e P(S2)=100%.
I risultati sono riassunti nel grafico che segue, dove Serie 1, serie 2 e serie 3 sono rispettivamente esperimenti fatti variando il margine di S2 su S1, rispettivamente del 5% del 10% e del 20%.

Otteniamo delle curve a parabola con vertice nei pressi delle “probabilità centrali”, più accentuate quando il margine di S2 su S1 aumenta.
Ciò mi porterebbe a supporre che l’ipotesi da me formulata sia vera (dando per scontato che questa non vuole assolutamente proporsi come una dimostrazione seria bensì come semplice constatazione).
Se l’ipotesi fosse vera non sarebbe secondo voi lecito ad esempio preferire scommesse su eventi con probabilità media anziché su probabilità estreme?
Questa è solo una dei possibili utilizzi di questa teoria, ad esempio si avrebbe maggior certezza nel valutare uno scommettitore migliore di un altro nel breve periodo se questi abbiano scommesso su probabilità estreme anziché su probabilità medie.
Sarebbe interessante sapere quale sia la funzione di questa parabola in base alle variabili.
[size=85]PS.
Sono sicuro che comunque queste siano cose già note a tutti ed il mio è sicuramente stato un esperimento (passatemi il termine) o più che altro un passatempo che mi ha permesso di divertirmi qualche oretta. Mi dispiace solamente perché le mie conoscenze matematiche non sono in grado di soddisfare tutti i miei dubbi, ma non lo rimpiango dato che la mia scelta universitaria è stata tutt’altra.[/size]
Sono in attesa di vostri commenti!
Buona giornata a tutti.
Risposte
Se servono anche i dati che ho ottenuto e con i quali ho creato il grafico li posto volentieri.
interessante esperimento.Ma neanchio ne sò abbastanza per dare dei pareri.
Però ho realizzato un programma in python che tramite un algoritmo e la lettura automatica su internet della classifica giornata per giornata calcola la previsione sui risultati:
parte dell'algoritmo è:
media gol fatti in casa* media gol subiti fuori casa= risultato squadra che gioca in casa
media gol segnati fuori casa* media gol subiti in casa= risultato squadra che gioca fuori casa
altre variabili inserite sono:
1) punteggio della rosa in base alla quotazione dei giocatori della formazione più probabile schierata nella partita (sempre una lettura e somma automatizzata dal programma)
2) correzione del risultato in base ad una particolare forma della squadra, ad esempio se una squadra in questione ha vinto le ultime 4 partite, avrà un occhio di riguardo in più..
se ti interessa una collaborazione su questi temi ti lascio la mia mail
[clear]
se non mi porta via troppo tempo potrei pubblicare in rete le previsioni e quindi il livello di bontà dell'algoritmo
[xdom="hamming_burst"]se vuoi lasciarli un contatto ti consiglio di mandargli un PM, lasciare l'email in chiaro senza qualche accorgimento come la dicitura "dot", ti causerà spam. Per evitarti questo ho "censurato" la tua email[/xdom]
Però ho realizzato un programma in python che tramite un algoritmo e la lettura automatica su internet della classifica giornata per giornata calcola la previsione sui risultati:
parte dell'algoritmo è:
media gol fatti in casa* media gol subiti fuori casa= risultato squadra che gioca in casa
media gol segnati fuori casa* media gol subiti in casa= risultato squadra che gioca fuori casa
altre variabili inserite sono:
1) punteggio della rosa in base alla quotazione dei giocatori della formazione più probabile schierata nella partita (sempre una lettura e somma automatizzata dal programma)
2) correzione del risultato in base ad una particolare forma della squadra, ad esempio se una squadra in questione ha vinto le ultime 4 partite, avrà un occhio di riguardo in più..
se ti interessa una collaborazione su questi temi ti lascio la mia mail
[clear]
se non mi porta via troppo tempo potrei pubblicare in rete le previsioni e quindi il livello di bontà dell'algoritmo
[xdom="hamming_burst"]se vuoi lasciarli un contatto ti consiglio di mandargli un PM, lasciare l'email in chiaro senza qualche accorgimento come la dicitura "dot", ti causerà spam. Per evitarti questo ho "censurato" la tua email[/xdom]
"BryanM":
Consideriamo 2 scommettitori che hanno un’abilità differente, chiamiamoli S1 ed S2: S2 indovina il 5% in più delle partite che indovina S1.
Quindi se un evento ha probabilità di successo = 0,50, allora P(S1) = 0,50 e P(S2) = 0,55.

Rovesciamo il ragionamento: S1 è uno scommettitore medio, S2 è più abile ed indovina il 5% in più.
- in un evento A, S1 indovina 50 volte su 100 $->$ S2 il 5% in più, quindi 52/53 volte su 100;
- in un evento B, S1 indovina 80 volte su 100 $->$ S2 84 volte;
- in un evento C, S1 indovina 10 volte su 100 $->$ S2 10/11 volte.
il tutto "mediamente". Il tuo calcolo su un cd. margine di differenza è quindi basato su altre assunzioni.
Hai messo assieme un mucchio di carne al fuoco. Ammiro il tuo sforzo di "ricerca". E sono conteneto, nel mio piccolo, e col tempo limitato di darti una mano.
Pensiamo ad un dado con 6 facce numerate da 1 a 6. se non ci sono trucchi la probabilità di pario o dispari è del 50%. Vogliamo fare esperimenti per capire se è truccato. Dopo 100 lanci ciascun esito deve avere una media di 50 ed una varianza di 100*0,5*0,5=25 , e quindi una deviazione standard pari alla sua radice quadrata, ossia 5. Quindi il numero di pari puo' stare fra 50- 2 o 3 deviazioni (a seconda del margine di confidenza che vuoi raggiungere) e 50+ 2 o 3 deviazioni. Quindi se il pari esce più di 65 o meno di 35 è quasi certo che c' il trucco. Su 10000 lanci, la media è 5000 , la varianza è 10000 *0,5*0,5=2500, la deviazione standard è 50 e quell' intervallo di cui sopra è da 4850 a 5150. Un dado che , truccato, spostasse mediamente i risultati da 50 e 50 a 52 e 48 verrebbe scoperto. Un dado che si comporta 51 a 49 non verrebbe scoperto-
Ora puoi immaginare che i tuoi due scommettitori siano S1= quello che indovina il 50% ed S2 quello che pensa di indovinare più spesso di S1. Con 10000 test il margine di indecisione fra S1 ed S2 diventa abbastanza piccolo, ossia capire se effettivamente S2 è migliore di S1.
Nell' esperimento di cui sopra invece di prevedere il pari/dispari prevediamo la quantità di uscite con 1: Se il dado è OK deve uscire 1 volta su 6 mediamente. Su 10000 lanci deve uscire 1667 volte in media. Con che varianza? 10000*0,1666*0,8333, ossia 1389 ed una deviazione standard di 37 (la sua radice quadrata). La deviazione al centro era di 50 e qui è solo di 37. Questo significa che effettivamente qui bastano meno esperimenti per valutare se ci sono trucchi nel dado (leggasi diverse capacità predittive nel tuo caso).
Provando con altri valori più estremi ottieni proprio la "similparabola" che hai ricavato sperimentalmente, in realtà un arco di cerchio, credo. Con equazione y=radq(x*(1-x)) con x che va da 0 a 1
Adesso però bisogna fare anche ipotesi più realistiche sulle effettive capacità predittive dei giocatori.
Su eventi dati generalmente attorno al 50% è realistico pensare che qualche esperto possa arrivare al 55%; non è altrettanto realistico che eventi dati generalmente al 5% possano essere previsti al 10% da un pronosticatore "migliore". Penso che la diversa "capacità predittiva" non sia un termine additivo, ma casomai moltiplivativo. Mi spiego: laddove negli eventi incerti il 50% di S1 puo' diventare il 55% di S2, negli eventi dove S1 indica 20% S2 potrebbe essere solo il 22%. E via di seguito: dove ilS1 dice 10%, S2 direbbe forse 11% .
Non credi?
Una annotazioen anche per l' amico che ha messo a punto un modello matematico. Per prevedere i goal fatti dalla squadra in casa sembra moltiplicare due medie goal, se non ho capito male. Penso invece che sia meglio fare la media fra quelle due medie. Non credi?
Pensiamo ad un dado con 6 facce numerate da 1 a 6. se non ci sono trucchi la probabilità di pario o dispari è del 50%. Vogliamo fare esperimenti per capire se è truccato. Dopo 100 lanci ciascun esito deve avere una media di 50 ed una varianza di 100*0,5*0,5=25 , e quindi una deviazione standard pari alla sua radice quadrata, ossia 5. Quindi il numero di pari puo' stare fra 50- 2 o 3 deviazioni (a seconda del margine di confidenza che vuoi raggiungere) e 50+ 2 o 3 deviazioni. Quindi se il pari esce più di 65 o meno di 35 è quasi certo che c' il trucco. Su 10000 lanci, la media è 5000 , la varianza è 10000 *0,5*0,5=2500, la deviazione standard è 50 e quell' intervallo di cui sopra è da 4850 a 5150. Un dado che , truccato, spostasse mediamente i risultati da 50 e 50 a 52 e 48 verrebbe scoperto. Un dado che si comporta 51 a 49 non verrebbe scoperto-
Ora puoi immaginare che i tuoi due scommettitori siano S1= quello che indovina il 50% ed S2 quello che pensa di indovinare più spesso di S1. Con 10000 test il margine di indecisione fra S1 ed S2 diventa abbastanza piccolo, ossia capire se effettivamente S2 è migliore di S1.
Nell' esperimento di cui sopra invece di prevedere il pari/dispari prevediamo la quantità di uscite con 1: Se il dado è OK deve uscire 1 volta su 6 mediamente. Su 10000 lanci deve uscire 1667 volte in media. Con che varianza? 10000*0,1666*0,8333, ossia 1389 ed una deviazione standard di 37 (la sua radice quadrata). La deviazione al centro era di 50 e qui è solo di 37. Questo significa che effettivamente qui bastano meno esperimenti per valutare se ci sono trucchi nel dado (leggasi diverse capacità predittive nel tuo caso).
Provando con altri valori più estremi ottieni proprio la "similparabola" che hai ricavato sperimentalmente, in realtà un arco di cerchio, credo. Con equazione y=radq(x*(1-x)) con x che va da 0 a 1
Adesso però bisogna fare anche ipotesi più realistiche sulle effettive capacità predittive dei giocatori.
Su eventi dati generalmente attorno al 50% è realistico pensare che qualche esperto possa arrivare al 55%; non è altrettanto realistico che eventi dati generalmente al 5% possano essere previsti al 10% da un pronosticatore "migliore". Penso che la diversa "capacità predittiva" non sia un termine additivo, ma casomai moltiplivativo. Mi spiego: laddove negli eventi incerti il 50% di S1 puo' diventare il 55% di S2, negli eventi dove S1 indica 20% S2 potrebbe essere solo il 22%. E via di seguito: dove ilS1 dice 10%, S2 direbbe forse 11% .
Non credi?
Una annotazioen anche per l' amico che ha messo a punto un modello matematico. Per prevedere i goal fatti dalla squadra in casa sembra moltiplicare due medie goal, se non ho capito male. Penso invece che sia meglio fare la media fra quelle due medie. Non credi?
"BryanM":
[size=85]
Consideriamo 2 scommettitori che hanno un’abilità differente, chiamiamoli S1 ed S2: S2 indovina il 5% in più delle partite che indovina S1.
Quindi se un evento ha probabilità di successo = 0,50, allora P(S1) = 0,50 e P(S2) = 0,55.
S1 ed S2 scommettono su partite differenti quindi nel breve termine è lecito aspettarsi che ci sia una qualche probabilità che si possa “trovare avanti” S1. Nel lungo termine ovviamente si troverà avanti S2 avendo un 5% di margine su S1.
Il problema è interessante, ma non è dei più semplici. In questi casi la difficoltà matematica maggiore spesso è nella modellizzazione. E' necessario essere precisi e definire bene le cose.
Chiamiamo $X_1$ ed $X_2$ le variabili aleatorie che contano i successi, in $n$ prove(giocate) indipendenti, degli scommettitori S1 ed S2.
In pratica ti stai chiedendo quanto vale $P(X_1 > X_2)$
"BryanM":
[size=85]
Ora la mia ipotesi è questa: “Se i giocatori scommettono su eventi avendo probabilità vicine al 50% di vittoria la probabilità che nel breve termine S1 abbia vinto più di S2 è maggiore che se gli eventi su cui scommettono avessero probabilità di vittoria o molto alte o molto basse”.
Di conseguenza ciò che ipotizzo è che nel breve termine la maggior bravura di S2 sia più facilemente evidenziabile se gli eventi abbiano o basse o alte probabilità di vittoria.
Il calcolo che fai è un po intricato rispetto al modello teorico che ho in mente io, ma sembra sensato. I risultati che raggiungi, favorevoli all'ipotesi, sono sensati (anche se sui dettagli del procedimento e sui risultati numerici ci sarebbe da approfondire).
Le due variabili $X_1$ ed $X_2$ si distribuiscono, per costruzione, come delle binomiali di parametri $p_1$ $n$ e $p_2$ $n$ rispettivamente. Dove la dimensione di $n$ la puoi intendere come la lunghezza del tempo di attesa misurato in quantità di scommesse. Alla luce di questo si può ricavare, tramite il teorema delle probabilità totali, la formula risolutiva di $P(X_1 > X_2)$.
Ho fatto i conti per $n=10$
e muovendo $p_1$ e $p_2$ come suggerivi tu, ovvero $p_2=p_1+0,05$ si ricava
p1 p2 p(X1 > X2)
0 0,050 0
0,050 0,100 0,175571645
0,100 0,150 0,24100796
0,200 0,250 0,293582554
0,300 0,350 0,315291302
0,400 0,450 0,324711356
0,500 0,550 0,326426719
0,600 0,650 0,321120878
0,700 0,750 0,306538313
0,800 0,850 0,273827145
0,900 0,950 0,175571645
0,950 1,000 0
la regione di massimo è proprio attorno a 0,5 ed il comportamento similparabola è regolare. Che per valorori estremi delle probabilità si ottenesse zero a ben vedere era ovvio, la regolarità sul restante spazio un po meno.
Tuttavia cosi facendo "l'incremento di bravura" in termini proporzionali è tutt'altro che costante, passare da 0,5 a 0,55 è un conto ma da 0,05 a 0,1 o da 0,9 a 0,95 è tutt'altro.
Ritengo maggiormente interessante impostare aumenti proporzionalmente, non numericamente, costanti con:
$p_2=p_1+0,05*p_1$
e ripetere il procedimento.
I risultati sono questi
p1 p2 p(X1 > X2)
0,010 0,011 0,08644726
0,030 0,032 0,198901355
0,050 0,053 0,262775676
0,100 0,105 0,332074909
0,200 0,210 0,367882798
0,300 0,315 0,375860913
0,400 0,420 0,374979044
0,500 0,525 0,368442261
0,600 0,630 0,356110545
0,700 0,735 0,335209573
0,800 0,840 0,296534761
0,900 0,945 0,192931341
0,950 0,998 0,014888739
la regione di massimo non è proprio attorno a 0,5 ma tra 0,3 e 0,4, si perde la quasi-simmetria precedente e la pancia tende agli estremi più lentamente, ma la sostanza non cambia, all'avvicinarsi degli estremi le probabilità si abbassano comunque. Questo risultato, come il precedente, conferma la validità della tua ipotesi concettuale; che quindi si dimostra vera perché al variare di $n$ le probabilità si abbassano all'unisono (come prevedibile) ma non accadono cose strane.
"BryanM":
[size=85]
Se l’ipotesi fosse vera non sarebbe secondo voi lecito ad esempio preferire scommesse su eventi con probabilità media anziché su probabilità estreme?
se quello che interessa sta nel capire cosa ci dice la matematica e prima necessario chiarire bene cosa si intende con la parola "preferire".
"BryanM":
[size=85]
si avrebbe maggior certezza nel valutare uno scommettitore migliore di un altro nel breve periodo se questi abbiano scommesso su probabilità estreme anziché su probabilità medie.
Si,
nel senso che dato un numero di prove, se le probabilità sono estreme, la probabilità che lo scommettitore meno bravo bratta il più bravo è minore.
"BryanM":
[size=85]
Sarebbe interessante sapere quale sia la funzione di questa parabola in base alle variabili.
Non è una parabola ma in generale la formula è questa
$P(X_1 > X_2)=sum_t P(X_1 > t)*P(X_2=t)$
dove $t$ è un indice che spazia per i possibili valori delle X.
Nel nostro caso si passa attraverso le binomiali. Adesso è tardi, se ti interessa poi te la esplicito.
N.B:
scusate le tabelle che si leggono male, ma con un po di sforzo...