Lotto: ambo che non esce

Faussone
Oggi vedendo questo filmato[nota]Per inciso io sono dell'idea che si tratta di una coincidenza dovuta allo scambio del numero 27 col 21 e della conseguente sfiga che il 21 sia uscito dopo, certo non si può esserne sicuri, ma trovo improbabile una combine così male organizzata che uno dei responsabili conoscesse la sequenza dei numeri e si fosse tradito; perché mai sarebbe stato necessario mettere a conoscenza il tecnico che fa apparire i numeri in sovra impressione dei numeri che sarebbero usciti?[/nota], tra i vari commenti sul fatto ne ho letto uno che riporto qui di seguito.

chissà da quanti decenni truccano il lotto. Possibile che da 6000 estrazioni non esca il 17-56 a bari ? Un ambo, con 5 nr estratti ha una probabilità su 400 di uscire. Secondo media matematica sarebbe dovuto uscire almeno 15 volte ! Molto strano. Probabilmente vedono che molta gente punta all'ambo 17-56 e quando decidono di "estrarre" il 17, tolgono il 56 e viceversa. Non mi stupirei visti i livelli di corruzione e marciume che contraddistingue l'Italia.


Ecco vorrei vedere, numeri alla mano, se la probabilità che tale ambo non esca per tutte quelle volte sia davvero così bassa da poter essere considerato come evento sospetto. Un volontario che fa i calcoli?
Io qualche tempo fa ho fatto qualcosa di simile in questa discussione sulla roulette, vorrei rifare qualcosa del genere per questo caso, ma non ho il tempo/voglia ora.

Grazie a chi si cimenterà!

Risposte
Faussone
Mi sono reso conto che il quesito è forse molto più banale di quello che pensavo e devo dire che la probabilità che un certo ambo non esca per 6000 estrazioni è così rara da essere per forza un evento sospetto (se qualcuno ha voglia di fare i conti, che sono semplici....)
Possibile che sia vero? Intendo che se davvero per tutte quelle estrazioni quell'ambo non è uscito mi pare ci debba essere qualche manipolazione per forza.
O c'è qualcosa che mi sfugge? Che sia da considerare, in analogia a quanto ho fatto per la discussione sulla roulette linkata sopra, la probabilità che, date tutte le possibili coppie di numeri, ce ne sia almeno una che non esca per quel numero di estrazioni? Certo in tal caso la probabilità che un evento simile si verifichi sarebbe molto più alta (anche qui se qualcuno vuole fare il conto)... Però non saprei quale criterio sia più giusto per valutare se l'evento sia sospetto.

Cosa ne pensate?

nino_12
(Salvo errori) questo è il massimo ritardo che ci si può attendere mediamente per ambo su ruota fissa in una serie di numeri.

La partenza per il calcolo è la formula del decadimento, che descrive anche l'andamento estrazionale del lotto:

$N = (No) * exp(-Kd*E)$

dove $N$ rappresenta i numeri vergini partendo da $No$, dopo $E$ estrazioni, mentre $Kd$ è la costante di decadimento, che io esprimo come logaritmo naturale dell'inverso della probabilità contraria per un determinato evento.
Per l'estratto, $Kd = ln(1/(17/18)) = ln(18/17) = 0,057158$...
Per l'ambo in due numeri, $Kd = ln(1/(3995/4005)) = ln(4005/3995) = 0,0025$...
ecc...

Al posto di $(No)/N$ sostituiamo la massa estrazionale (rettificata per la situazione che si va ad esaminare) e al posto del numero di estrazioni $E$ sostituiamo il ritardo massimo ($Rmax$):

$M = exp(Rmax * Kd)$

Da cui:

$Rmax = ln(M)/(Kd)$

Non ci resta che formalizzare $M$, cioè la massa estrazionale, che nel caso dell'ambo è uguale al numero di estrazioni storiche (circa 9000) moltiplicato per le ruote (11) e per il numero di ambi che si hanno ad ogni estrazione di 5 numeri (10);
quindi:
$9.000 * 11 * 10 = 990.000$ che arrotondiamo a 1 milione, non cambia nulla...
Questo valore è però corretto solo nel caso si giochino due numeri per l'ambo!
Nel caso si abbia una serie (con n da 3 a 10 numeri), è necessario apportare una correzione, moltiplicando per questo fattore:
$Comb(88,n-2)$

In definitiva, indicando con $E$ il numero delle estrazioni, con $r$ il numero delle ruote e con $C$ il numero delle combinazioni:

$M = E * r * C(5,2) * C(88,n-2)$

Concludendo, per le serie da 2 a 10 numeri con sorte ambo, abbiamo questi valori di $M$, $Kd$ e $Rmax$:

2 Numeri -----> M = 1.000.000 -----> Kd = 0,002500001 -----> Rmax = 5526
3 Numeri -----> M = 8.800E+07 -----> Kd = 0,007347321 -----> Rmax = 2490
4 Numeri -----> M = 3.828E+09 -----> Kd = 0,014409497 -----> Rmax = 1531
5 Numeri -----> M = 1.097E+11 -----> Kd = 0,023571265 -----> Rmax = 1078
6 Numeri -----> M = 2.332E+12 -----> Kd = 0,034732095 -----> Rmax = 820
7 Numeri -----> M = 3.918E+13 -----> Kd = 0,047804177 -----> Rmax = 655
8 Numeri -----> M = 5.419E+14 -----> Kd = 0,062710756 -----> Rmax = 541
9 Numeri -----> M = 6.348E+15 -----> Kd = 0,079384756 -----> Rmax = 458
10 Numeri -----> M = 6.428E+16 -----> Kd = 0,097767627 -----> Rmax = 396


---------------
Per evitare equivoci, quello calcolato è il massimo ritardo MEDIO di una serie ripetuta di prove, ciascuna di x (=9000) estrazioni di 5 numeri per 11 ruote.
In realtà, NON esiste un massimo ritardo UNICO e vero in assoluto: non si può infatti escludere che un ambo NON esca mai per tutte le n estrazioni e quindi in teoria in questo caso il ritardo massimo sarebbe n.

Il vaglio statistico delle estrazioni dall'8 gennaio 1871 ad ora, circa 9000 estrazioni, conferma la validità dei risultati che ho riportato per l'ambo ( 3 numeri = 2372 estrazioni, 4 numeri = 1498 estrazioni, 5 numeri = 1054 estrazioni, ecc...) salvo il caso di 2 numeri, in cui il famigerato 17 - 56 di Bari ritarda di oltre 6200 estrazioni.

Faussone
Grazie nino_.
Confesso che non sono stato in grado di comprendere tutti i passaggi di ciò che hai scritto (conosco un po' di statistica, ma da dilettante e molte nozioni mi mancano), tuttavia posso dire che quello che hai riportato, seppur interessante, non risponde comunque ai miei dubbi.
Tu hai messo in luce, se ho capito bene, quanto sia il ritardo medio massimo che ci si può aspettare per l'uscita di un ambo in 9000 estrazioni nel caso si giochino due numeri, tre numeri ecc io invece mi chiedo quale sia la probabilità di poter avere un ritardo di un ambo per esempio pari a 6000 estrazioni, in altre parole quale è la probabilità che un ambo non esca per (almeno) 6000 estrazioni.

Chiedo questo per vedere se tale probabilità sia così bassa da considerare, ragionevolmente (visto che in statistica niente è certo al 100%), fraudolenta l'estrazione. Insomma voglio stimare la significatività (che è quello che si fa normalmente per valutare se un fenomeno è causale o no).

Il dubbio che ho è che posso vedere la cosa da diversi punti di vista:

1) assumo di aver osservato il 17 e 56 sulla ruota di Bari per 6000 estrazioni e di aver visto che non è mai uscito, la probabilità di verificarsi di una cosa del genere è davvero bassa (se non ho sbagliato i conti risulta attorno a 3 su 10milioni) tanto da far pensare che ci sia qualcosa di altamente sospetto.

2) assumo di osservare i ritardi di tutti i possibili ambi sulla ruota di Bari e di osservarne almeno uno pari a 6000 estrazioni, la probabilità che questo si verifichi è pari (errori a parte) a circa 1 su 1000 quindi, seppure sospetta, già lo è molto meno di prima.

3) assumo di osservare i ritardi di tutti i possibili ambi su 11 e ruote e di osservarne almeno uno pari a 6000, la probabilità che questo si verifica è superiore a 1 su 100, quindi già siamo a livelli statistici che non consentono l'uso del "ragionevolmente" con troppa disinvoltura.

4) Potrei anche complicare le cose e considerare tutte le estrazioni avvenute per esempio dal 1871 e calcolare la probabilità che almeno un ambo su almeno una ruota abbia avuto un ritardo di 6000 estrazioni e tirare fuori una probabilità ancora maggiore. O ancora osservare tutti i ritardi di tutte i possibili ambi, terni e quaterne ecc su tutte le ruote dal 1871 e vedere quanto valga la probabilità che ce ne sia almeno uno su almeno una ruota pari a 6000 estrazioni.
Oppure monitorare non solo l'uscita di ambi, terni ecc, ma nello stesso tempo tutte le altre possibili anomalie.

Come accade in statistica il punto di vista cambia notevolmente le cose...
Secondo voi quale sarebbe la maniera più ragionevole per valutare se questo famigerato ambo su Bari sia in qualche modo truccato?
Per l'esempio della roulette del link che ho messo sopra, in cui era stato detto che erano state osservate esplicitamente un certo numero di uscite di numeri e monitorate tutte le frequenze, è stato più semplice dimostrare che quella roulette aveva delle uscite sospette, ma qui non saprei.
Le anomalie accadono insomma...

Secondo me comunque è molto improbabile che ci sia un trucco e non per considerazioni statistiche ma logiche: chi avrebbe vantaggio a truccare la ruota di Bari? Lo Stato ha margini talmente ampi sul Lotto che non ha certo bisogno di ricorrere a trucchi (con i conseguenti rischi) per guadagnare, d'altra parte potrebbe aver senso truccare una ruota per far uscire dei numeri, ma non per ritardare un ambo.

fraxy1
cari matematici,non c'è bisogno di fare calcoli,i numeri hanno tutti le stesse probabilità di uscire,bisogna vedere anche di tutte le cinquine esistenti,quante cinquine contengono il 17 e il 56,è possibile che in n!(6000) eventi non sia ancora uscita una cinquina con il 17 e il 56 presenti,da notare che le cinquine sono divise per il numero di ruote,non è come il superenaloto,al lotto ci sono 10 ruote + nazionale,se un ambo esce per esempio ogni 500 estrazioni,anche meno,6000 sono poche per un'ambo su una ruota,almeno,per 500,dovrebbe uscire dopo circa 4000 strazioni,ma si sa,i numeri sono casuali,è possibile che esca come tra 32 anni come tra una settimana,le possibilità sono identiche,se uno gioca 1 euro o fa un sistemone da 15.000 euro le possibilità sono esattamente le stesse,come il sistemista può fare dall'ambo alla cinquina,anche quello che ha giocato 1 euro può

Faussone
"fraxy":
cari matematici,non c'è bisogno di fare calcoli,[....]


Grazie del tuo contributo, che tuttavia, mi spiace, è ben poco utile per me e, scusami, anche abbastanza banale.

Ti faccio notare che nessuno qui ha mai detto che in ogni singola estrazione la probabilità che esca un certo ambo cambi in alcun modo all'aumentare delle estrazioni, né nessuno ha mai detto che sia possibile dire a priori dopo quante estrazioni un certo ambo debba necessariamente uscire: è ovvio per chiunque conosca qualche elemento di statistica che una domanda del genere è del tutto priva di significato.

Il mio dubbio era come debba correttamente stimarsi la probabilità che un certo evento (uscita di un certo ambo) non si verifichi per un certo numero di estrazioni, per vedere se è possibile trarre conclusioni sulla regolarità delle estrazioni da un punto di vista meramente statistico e probabilistico, che è cosa ben diversa.
Rimando alla lettura del mio precedente messaggio a proposito, ne approfitto per stimolare commenti ai dubbi che avevo espresso lì.


@fraxi
Una cosa che c'entra (solo parzialmente) con questo discorso: lo sai che giocando un ambo tutte le settimane, indipendentemente dai numeri giocati (puoi giocare gli stessi numeri o cambiarli ogni volta e persino cambiare la ruota su cui giochi l'ambo), la tua probabilità di vincere aumenta ogni settimana? Peccato questo serva a poco: non è possibile dire dopo quante settimane vincerai ovviamente, ma solo stabilire in che modo la tua probabilità cresca all'aumentare delle giocate: dopo 6000 estrazioni hai una probabilità irrisoria di non aver ancora mai vinto, ma, incredibilmente anche se non avessi vinto per 5999 volte, nonostante tutto la probabilità che vincerai alla 6000 estrazione è comunque la stessa che se giochi per la prima volta. "Paradossi" della statistica. :-D

vict85
Ogni estrazione è indipendente l'una dall'altra. Quindi anche supponendo che l'ambo abbia $1/400$ di probabilità di uscire, la probabilità che non esca per 6000 estrazioni è $(399/400)^(6000)$. Un valore molto piccolo ma superiore alla probabilità di fare 6 al superenalotto.

In ogni caso il fatto che non sia uscita nelle precedenti 6000 estrazioni non aumenta la probabilità che esca nella successiva.

Faussone
Grazie vict85, ma questo è più o meno quello che ho detto anch'io...
Riesci invece a dire cosa ne pensi rispetto a quanto dicevo [url=http://anonymouse.org/cgi-bin/anon-www.cgi/http://www.matematicamente.it/forum/viewtopic.php?p=942781&sid=09b5acf86304e0c1782f19aa3c7ab908&sid=09b5acf86304e0c1782f19aa3c7ab908#p942781]qui[/url]?

vict85
Si può utilizzare un test di ipotesi per testare se il sistema è equo, ma non esiste un massimo. Insomma l'evento che quell'ambo non esca mai ha probabilità 0, ma questo non lo rende impossibile.
Inoltre i test di ipotesi hanno un livello di significatività ben preciso. Ovvero possono al più dire che è altamente probabile che sia truccato, ma non forniscono certezze.

Faussone
"vict85":
Si può utilizzare un test di ipotesi per testare se il sistema è equo

Puoi darmi riferimenti su questo? Sono curioso di vedere di cosa si tratta.

"vict85":

Inoltre i test di ipotesi hanno un livello di significatività ben preciso. Ovvero possono al più dire che è altamente probabile che sia truccato, ma non forniscono certezze.

Certo lo so bene, ma è ovvio che se un evento ha una probabilità inferiore allo 0.1% di verificarsi per caso vuol dire che probabilmente (non certamente) non è frutto del caso. D'altronde in medicina si usano soglie di significatività dello 0.1% o anche più alte per testare l'effetto di un nuovo farmaco o di un trattamento.

La domanda non era tanto su questo comunque, ma su quale punto di vista sarebbe più opportuno adottare per valutare la significatività (tra le opzioni 1-2-3-4 ecc che avevo descritto sopra quale ti/vi sembrava ragionevole?) dell'evento "non uscita di un ambo in 6000 estrazioni". Nella discussione sulla roulette linkata sopra avevo usato un approccio simile, ma lì era più semplice scegliere il punto di vista per valutare al significatività.

Può anche darsi che stia sbagliando l'approccio metodologico, ma a me questa pare l'unica strada per pesare quanto un certo evento possa essere o no casuale.

axpgn
Considerazione pratica: se "complotto" esiste è partito più di cinquant'anni fa (quando già il ritardo passava le $2000$ estrazioni) e si tramanda di generazione in generazione; a me questa eventualità sembra meno probabile del ritardo stesso ... :-D

Se si consulta il sito di Lottomatica si può vedere che i primi tre ambi ritardatari per ciascuna ruota hanno un ritardo superiore alle $3000$ estrazioni (che vuol dire almeno trent'anni) ... mi sembrano un po' tante le palline che mancano :wink:

Cordialmente, Alex

nino_12
In passato avevo fatto un foglio excel per calcolare la probabilità di avere al lotto un certo numero di numeri (sui 90) che escono in funzione del numero di estrazioni.
Ad esempio, dopo aver estratto 100 cinquine, c'è il 25,8987% di probabilità che un numero non sia ancora uscito.
Approssimando con la distribuzione di Poisson, il risultato che si ottiene è molto simile (25,6513%)

Analogamente penso si possa procedere per l'ambo: la probabilità di avere al lotto l'uscita di tutti i 4005 ambi dopo 6000 estrazioni su singola ruota è (circa) = 0,99877562
Infatti, la probabilità che ci sia almeno un ambo mai apparso su una ruota dopo 6000 estrazioni è (circa):
= 1-EXP(-((3995/4005)^6000*4005)) = 0,00122438
o anche:
= 1-(1-(3995/4005)^6000)^4005) = 0,00122438

Lo stesso calcolo su 10 ruote dà una probabilità di 1-0,99877562^10 = 0,01217655

Faussone
@axpgn
Concordo che le possibilità di complotto siano pressoché nulle. E questo per motivi di opportunità, se non per altro.
Insomma penso che nessuno abbia interesse a far ritardare un ambo (o più ambi) per tutti questi anni per trarne vantaggio, né ha senso per lo stato ritoccare le estrazioni per aumentare i margini di guadagno che sono già di per se amplissimi. Basta la statistica per assicurare sul medio/lungo termine allo stato di guadagnare sul gioco del lotto.
Fanno ridere tutti questi guru e sistemisti del lotto, non riescono a capire una cosa basilare: il metodo più sicuro per vincere al lotto è semplicissimo, non giocare.

nino_12
"Faussone":
sistemisti del lotto, non riescono a capire una cosa basilare: il metodo più sicuro per vincere al lotto è semplicissimo, non giocare.


OK, ma non devi generalizzare.

La sistemistica (covering design)
http://www.ccrwest.org/cover/cover.pdf
viewtopic.php?f=12&t=141055
http://www.weefs-lottosysteme.de/improvements,en.htm

è una branca affascinante della matematica.
Iindipendentemente dalla utilità pratica dei sistemi ridotti nei vari concorsi aleatori o di abilità.

Faussone
"nino_":
[quote="Faussone"]sistemisti del lotto, non riescono a capire una cosa basilare: il metodo più sicuro per vincere al lotto è semplicissimo, non giocare.


OK, ma non devi generalizzare.
[/quote]

No, non volevo generalizzare, anche perché non so neanche cosa potrei generalizzare: forse ho usato la parola sistemisti in modo inappropriato, quello che volevo dire è banalmente che non esistono "teorie" in grado di aiutare a vincere al lotto. Tutto lì. O sbaglio? :shock:

Grazie per i link, ho il sospetto che non sia per me facile darci uno sguardo e capire subito di cosa si parla però.
Riusciresti a spiegarmi (se possibile) in poche parole cosa tratta il covering design?

Faussone
"nino_":
In passato avevo fatto un foglio excel per calcolare la probabilità di avere al lotto un certo numero di numeri (sui 90) che escono in funzione del numero di estrazioni.
Ad esempio, dopo aver estratto 100 cinquine, c'è il 25,8987% di probabilità che un numero non sia ancora uscito.
Approssimando con la distribuzione di Poisson, il risultato che si ottiene è molto simile (25,6513%)

Analogamente penso si possa procedere per l'ambo: la probabilità di avere al lotto l'uscita di tutti i 4005 ambi dopo 6000 estrazioni su singola ruota è (circa) = 0,99877562
Infatti, la probabilità che ci sia almeno un ambo mai apparso su una ruota dopo 6000 estrazioni è (circa):
= 1-EXP(-((3995/4005)^6000*4005)) = 0,00122438
o anche:
= 1-(1-(3995/4005)^6000)^4005) = 0,00122438

Lo stesso calcolo su 10 ruote dà una probabilità di 1-0,99877562^10 = 0,01217655


Tutto questo coincide con i conti che avevo fatto. Grazie per aver confermato.

La domanda non era tanto sull'esattezza di questi numeri però, ma piuttosto sul punto di vista migliore per valutare la probabilità di non uscita di un ambo per 6000 estrazioni allo scopo di dire che l'evento ragionevolmente possa non considerarsi casuale (occorre valutare la probabilità di non uscita di un certo ambo su una ruota,o la probabilità di uscita di almeno un ambo su una certa ruota, o la probabilità di uscita di almeno un ambo su almeno una delle 10-11 ruote? o ...ecc?)

nino_12
"Faussone":
forse ho usato la parola sistemisti in modo inappropriato,


Esattamente! Quelli cui ti riferisci sono i "ritardisti"

"Faussone":

in poche parole cosa tratta il covering design?


Di progettazione e realizzazione di "sistemi ridotti" a garanzia di vincita con determinate condizioni.

----------
Per sistema si intende un aggregato particolare di combinazioni (in coppie, terzine, ..., decìne, ecc...) che nel loro insieme hanno determinate caratteristiche e proprietà di rappresentazione.
I sistemi vengono definiti "integrali" (se sono composti da tutte le possibili combinazioni e quindi il loro utilizzo condurrà inevitabilmente a vincita piena certa) o "ridotti" *(se sono composti da un numero minore di combinazioni e quindi, se si giocano, costano meno; c'è però l'handicap che potrebbero non dare la vincita piena, che si identifica con il punteggio massimo N, ma, se non vi è "incolonnamento della combinazione vincente", danno solo la garanzia di una vincita con punteggio inferiore, di 1 , 2, ... punti, che si chiama N-1, N-2, ecc...)
Ci sono poi i "sistemi condizionati", ma per adesso lasciamo perdere...

I sistemi numerici si rappresentano convenzionalmente in questo modo:

v, k, t, m = b

associando ad ogni lettera un numero, con il seguente significato:
v = numero totale degli elementi che costituiscono il sistema (es. 90 numeri)
k = numero degli elementi che sono presenti in ogni blocco-combinazione (es. sestine)
t = punteggio minimo garantito dal sistema, ossia numero minimo di estratti presenti in una stessa combinazione del sistema (es. 3 per il superenalotto)
m = numeri che, tra quelli che vengono sorteggiati ad ogni estrazione, devono essere contenuti nel sistema (es. 6 per il superenalotto, 20 per il 10elotto, ecc...)
b = dimensione del sistema, cioè numero dei blocchi (combinazioni, dette normalmente colonne) di cui è composto

Ad esempio, 90,6,3,6 = 1124 e 20,10,7,10 = 30 sono due sistemi ridotti, attuali "primati", perché con 90 numeri la soluzione migliore a garanzia di 3 punti è di 1124 sestine e con 20 numeri il record a garanzia di 7 punti (utilizzabile ad esempio per winforlife) è di 30 decine.
viewtopic.php?f=12&t=141055#p894044

markowitz
"Faussone":
Grazie nino_.

Il dubbio che ho è che posso vedere la cosa da diversi punti di vista:

1) assumo di aver osservato il 17 e 56 sulla ruota di Bari per 6000 estrazioni e di aver visto che non è mai uscito, la probabilità di verificarsi di una cosa del genere è davvero bassa (se non ho sbagliato i conti risulta attorno a 3 su 10milioni) tanto da far pensare che ci sia qualcosa di altamente sospetto.

2) assumo di osservare i ritardi di tutti i possibili ambi sulla ruota di Bari e di osservarne almeno uno pari a 6000 estrazioni, la probabilità che questo si verifichi è pari (errori a parte) a circa 1 su 1000 quindi, seppure sospetta, già lo è molto meno di prima.

3) assumo di osservare i ritardi di tutti i possibili ambi su 11 e ruote e di osservarne almeno uno pari a 6000, la probabilità che questo si verifica è superiore a 1 su 100, quindi già siamo a livelli statistici che non consentono l'uso del "ragionevolmente" con troppa disinvoltura.

4) Potrei anche complicare le cose e considerare tutte le estrazioni avvenute per esempio dal 1871 e calcolare la probabilità che almeno un ambo su almeno una ruota abbia avuto un ritardo di 6000 estrazioni e tirare fuori una probabilità ancora maggiore. O ancora osservare tutti i ritardi di tutte i possibili ambi, terni e quaterne ecc su tutte le ruote dal 1871 e vedere quanto valga la probabilità che ce ne sia almeno uno su almeno una ruota pari a 6000 estrazioni.
Oppure monitorare non solo l'uscita di ambi, terni ecc, ma nello stesso tempo tutte le altre possibili anomalie.

Come accade in statistica il punto di vista cambia notevolmente le cose...
Secondo voi quale sarebbe la maniera più ragionevole per valutare se questo famigerato ambo su Bari sia in qualche modo truccato?
Per l'esempio della roulette del link che ho messo sopra, in cui era stato detto che erano state osservate esplicitamente un certo numero di uscite di numeri e monitorate tutte le frequenze, è stato più semplice dimostrare che quella roulette aveva delle uscite sospette, ma qui non saprei.
Le anomalie accadono insomma...

Secondo me comunque è molto improbabile che ci sia un trucco e non per considerazioni statistiche ma logiche: chi avrebbe vantaggio a truccare la ruota di Bari? Lo Stato ha margini talmente ampi sul Lotto che non ha certo bisogno di ricorrere a trucchi (con i conseguenti rischi) per guadagnare, d'altra parte potrebbe aver senso truccare una ruota per far uscire dei numeri, ma non per ritardare un ambo.


Per quanto riguarda valutare se sia "strano" o meno che l'ambo $17 , 56$ (o qualsiasi altro) non esca per $6000$ estrazioni consecutive si procede come avete già detto, io scriverei $p = (1-10/4005)^N$ ed a me risulta che per $N=2000$ siamo già sotto l'$1%$ per $N=6000$ ... siamo praticamente a zero ... quindi SI fermandoci a questo si può dire che ciò che si è osservato è statisticamente molto improbabile, quindi sospetto.

Più problematico quello che dici sui punti di vista, anche io avevo ragionato su problemi simili. Provo a risponderti.
La risposta breve è che, In generale, non esiste una sola domanda da potersi porre ma in questi contesti, se sai usare abbastanza bene gli strumenti statistici, riesci a trovare risposte coerenti a domande sensate ... niente di più :wink:
... dopodichè più strumenti hai in mano e più numerose e complicati saranno i problemi (sensati) a cui saprai dare risposta.
Per il resto se ci pensi è ovvio che a domande diverse darai risposte diverse ... l'impiortante è capire perché sono domande diverse :D le 1-2-3-4 che hai sopra scritto alla fine sono domande diverse ed è logico che abbiano diverse risposte ... ma tutte corrette e collegate in qualche modo.
Allora ti potresti chiedere, come se capisco bene è la tua intenzione, ma qual'è la domanda giusta che mi devo fare ? ... è chiaro che qui si può speculare a volontà. O più specificamente, se pretendo di avere la statistica dalla mia parte quando sostengo un'idea su un fenomeno aleatorio, roba del tipo: Il Lotto è truccato o no ? non esiste un solo modo d'impostare il problema ... forse la cosa migliore è generalizzare al massimo di cui si è capaci ... e direi che la strada di tommik è la più generale e quindi quella da preferire ... anche se le altre domande restano sempre sensate.
Ragionamenti simili sono estendibili a vari campi della scienza ... non esiste mica solo un modo per fare un esperimento ne un solo insieme di dati e sensato da osservare ne un solo strumento per analizzare.

Una delle poche cose di cui mi sto convincendo, in mood soggettivista, è che la probabilità è meglio usarla per ragionare su quello che accadrà (o che è comunque ignoto) più che su quello che è accaduto/conosciuto.

Io partivo, in un mio lontano ragionamento, dall'analisi della roulette: se, in verità, non ho motivi "fisici" indagati sul campo per ritenere che ci sia un "trucco" sarà allora inutile farsi troppi problemi per valutare le più disparate probabilità/test ... tanto lo so già che la ruota è buona ... la causa di tutto è solo il caso per definizione.
Se invece sul generatore di dati ho dubbi ... alle prime cose "strane" sarà meglio fare controlli intesi come non statistici ... tanto, a meno di errori algebrici o logici, difficilmente con un risultato statistico riuscirò a scalzare del tutto un'altro risultato statistico contrastante ... e se sono invece concordanti ancora a maggior ragione dovrei indagare ... quindi è meglio indagare comunque.

In ogni caso una risposta veramente esauriente non la ho ... ma evitare di fare confusione e trovare anche solo qualche risposta corretta a domanda sensata è già un ottimi risultato. :smt023

Faussone
@nino_
Anche se in ritardo (benché io sia tutt'altro che un ritardista :-D ) ti ringrazio per il chiarimento e la descrizione dei sistemi ridotti. E' qualcosa che non conoscevo per nulla e sicuramente molto interessante, anche se esula dall'argomento della discussione.

@markowitz
Grazie per il contributo.
(Il mio dubbio non era sulla sorpresa di ottenere risultati diversi a secondo del punto di vista, quello è ovvio e ci sta in statistica, il dubbio era quale fosse il metodo da scegliere in questo caso specifico.)

Capisco cosa dici, anche se io sono giunto a conclusioni leggermente diverse (forse si tratta solo di sfumature credo che nel nocciolo della questione concordiamo). Secondo me l'approccio che ho descritto va bene, ma è importante scegliere bene cosa osservare e come osservarlo ed essere coerenti con il metodo scelto, senza manipolare a posteriori il punto di vista.
Insomma se dico di scegliere un numero intero a caso tra gli infiniti interi, la probabilità che venga scelto un certo numero è nulla, ma una volta che l'utente ha scelto un preciso numero, non posso poi dire che la scelta non è casuale perché l'utente ha scelto quel preciso numero che avrebbe probabilità zero di essere scelto. Bisogna sempre fare attenzione a non cadere in questo vizio logico insomma.

markowitz
"Faussone":

Capisco cosa dici, anche se io sono giunto a conclusioni leggermente diverse (forse si tratta solo di sfumature credo che nel nocciolo della questione concordiamo). Secondo me l'approccio che ho descritto va bene, ma è importante scegliere bene cosa osservare e come osservarlo ed essere coerenti con il metodo scelto, senza manipolare a posteriori il punto di vista.

Si è proprio così.

In definitiva, per restare a questo caso, la spiegazione che mi do alla problematica è:
- la prob che l'ambo $17,56$ si faccia attendere per più di 6.000 estrazioni sulla ruota di Bari è circa $(3,05)/(10.000.000)$
- la prob che l'ambo maggiormente ritardatario sulla ruota di Bari si faccia attendere per più di 6.000 estrazioni è già molto maggiore ma comunque piccola circa $(1,22)/(1000)$
- la prob che l'ambo maggiormente ritardatario su tutte le ruote si faccia attendere per più di 6.000 estrazioni è ancora maggiore ed è circa $1,218%$

e questi risultati dovrebbero essere tutti coerenti e corretti e rispondendo a domande diverse è ovvio che siano diversi.

Ma la domanda che veramente ti interessa alla fine qual'è? E' prima di tutto questa la domanda a cui rispondere in modo non equivoco.
Diciamo che la la domanda/obbiettivo è capire se l'estrazione del Lotto è "regolare" oppure no. Quindi è domanda molto generale/ambiziosa.
Lo si può valutare partendo dai dati sull'ambo $17,56$ ? Sicuramente è un punto di partenza valido, e la risposta sarebbe:

- se avevamo osservato che l'ambo $17,56$ è stato assente per 6000 estrazioni sulla ruota di Bari senza sapere nient'altro potevamo concludere che come si suol dire, oltre ogni ragionevole dubbio, l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?

- se avevamo osservato che l'ambo $17,56$ è stato assente per 6000 estrazioni sulla ruota di Bari ed è anche quello più ritardatario su detta ruota senza sapere nient'altro potevamo concludere, con qualche dubbio in più ma comunque quasi con sicurezza, che l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?

- se avevamo osservato che l'ambo $17,56$ è stato assente per 6000 estrazioni sulla ruota di Bari ed è anche quello più ritardatario su ogni ruota senza sapere nient'altro potevamo concludere, con non troppa sicurezza, che l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?

E' normale che le conclusioni che si possono trarre, in generale, sono frutto dell'informazione oltre che di un corretto utilizzo della stessa. Direi allora, come ti anticipavo, che l'approccio da seguire è quello accennato da tommik. Focalizzarsi sull'ambo è un'ottica coerente ma troppo miope, si deve trattare in qualche modo di tutta la distribuzione è in effetti è questa la base informativa più ampia che abbiamo, e se conosciamo le estrazioni l'abbiamo, a cui possiamo e dovremmo fare in qualche modo riferimento ... ed appunto qualche perchè il modo non è uno solo ... anche se forse uno migliore esiste. In passato avevo fatto qualche prova in questo senso ed il risultato era che le estrazioni erano verosimili.

In ogni caso le conclusioni precedenti restano corrette, dipende tutto da quante informazioni si hanno e dall'essere attenti ed onesti nell'usarle. Dopodiché ci sta di trovare un dato marginalmente strano ma che poi nell'insieme diventa congiuntamente verosimile. L'informazione può fare la differenza, se ne hai poca ... o ti limiti nelle pretese ... o è più facile sbagliare :wink:

N.B: mi sto convincendo che focalizzarsi troppo sul passato ... mette duramente alla prova l'onestà. :-)

Faussone
Grazie markowitz.

Sono perfettamente d'accordo con quanto dici, in particolare faccio mio quello che dici qui.

"markowitz":

Ma la domanda che veramente ti interessa alla fine qual'è? E' prima di tutto questa la domanda a cui rispondere in modo non equivoco.
Diciamo che la la domanda/obbiettivo è capire se l'estrazione del Lotto è "regolare" oppure no. Quindi è domanda molto generale/ambiziosa.
Lo si può valutare partendo dai dati sull'ambo $ 17,56 $ ? Sicuramente è un punto di partenza valido, e la risposta sarebbe:

- se avevamo osservato che l'ambo $ 17,56 $ è stato assente per 6000 estrazioni sulla ruota di Bari senza sapere nient'altro potevamo concludere che come si suol dire, oltre ogni ragionevole dubbio, l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?

- se avevamo osservato che l'ambo $ 17,56 $ è stato assente per 6000 estrazioni sulla ruota di Bari ed è anche quello più ritardatario su detta ruota senza sapere nient'altro potevamo concludere, con qualche dubbio in più ma comunque quasi con sicurezza, che l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?

- se avevamo osservato che l'ambo $ 17,56 $ è stato assente per 6000 estrazioni sulla ruota di Bari ed è anche quello più ritardatario su ogni ruota senza sapere nient'altro potevamo concludere, con non troppa sicurezza, che l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?



Però quando scrivi questo:

"markowitz":

Focalizzarsi sull'ambo è un'ottica coerente ma troppo miope, si deve trattare in qualche modo di tutta la distribuzione è in effetti è questa la base informativa più ampia che abbiamo, e se conosciamo le estrazioni l'abbiamo, a cui possiamo e dovremmo fare in qualche modo riferimento ... ed appunto qualche perchè il modo non è uno solo ... anche se forse uno migliore esiste. In passato avevo fatto qualche prova in questo senso ed il risultato era che le estrazioni erano verosimili.


non capisco in pratica come si potrebbe procedere.
Anzi forse qualcosa intuisco, ma mi sorgono molte domande....

Se per un attimo ci spostiamo dal lotto al lancio di una moneta (che è un ambito un po' più ristretto) per verificare analogamente se, data una sequenza di N lanci, la moneta sia truccata o no, mi vengono per ora in mente due strade.

La prima è simile a quella che stavo seguendo per i lotto: conto il numero di T e C della sequenza e vedo che probabilità avrei in una sequenza di N lanci di ottenere un numero di T (appurato per esempio che nella sequenza abbia T > C) maggiori o uguali di quelle ottenute nella sequenza in oggetto, se ottengo una probabilità molto bassa dico che l'evento è sospetto.

Un secondo diverso modo di procedere potrebbe essere dividere la sequenza in tante sotto-sequenze di stessa lunghezza, ora data la lunghezza della sotto-sequenza so come è fatta la distribuzione discreta teorica della frequenza di teste e di croci, a questo punto la mia ipotesi nulla è che le diverse frequenze misurate nelle sotto-sequenze possano appartenere alla distribuzione discreta di T e C di lunghezza pari a quella delle sotto-sequenze, faccio un test (non so quale ma sicuramente ce ne è uno adatto per questo) e vedo la significatività per decidere se rigettare o no l'ipotesi nulla e dire quindi se la sequenza è sospetta o meno.

Non mi viene in mente niente altro infatti per fare un confronto con una distribuzione discreta nota.

Cosa altro potrei fare in questo caso? Ha senso il modo di procedere che ho scelto? Se sì, in base a cosa scelgo la lunghezza delle sotto-sequenze?

Come estendo poi questo all'esempio del lotto? Controllo usando le ultime 6000 estrazioni solo le frequenze di tutti i 90 numeri?
In qualche modo non dovrei controllare le frequenze di uscita di tutti i vari ambi e confrontare pure quelli con la relativa distribuzione teorica nota. Come?

Spero di esser riuscito a chiarire cosa intendo e di non aver usato un linguaggio improprio (ho detto tante volte che sono un dilettante riguardo a questi argomenti).

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.