Domanda di probabilità (terraterra)

giangianni1
Ciao a tutti,

sto seguendo un corso di laboratorio e definire infarinatura di probabilità quella che si studia in un laboratorio mi pare un insluto a chi davvero ha studiato tali argomenti. Tuttavia questo esame "s'ha da fare" e cerco di capire quel che posso con la ripromessa un giorno di approfondire.

Quello che mi porta a scrivervi è un dubbio riguardo a come si sia scoperto che la nota estrazione di una pallina da un urna e riemmissione non abbia una sua "memoria". (mi scuso per il poco formalismo ma è un po' la questione dei ritardatari che frega molte persone, ma non voglio farmi fregare anche io dall'intuito).

Sono riuscito a capire che sia così, ma non capisco se questo sia un assunto dato per certo (diciamo un principio primo tale per definizione), una cosa che si è scoperta empircamente.

RIngrazio chi vorra dedicare dle tempo alla mia sciocca domanda.

Risposte
ghira1
Se non mischi bene le palline un qualche tipo di memoria l'urna potrebbe anche averla.

giangianni1
Si certo, hai ragionissima. Intendevo senza introdurre un bias di pescaggio. Insomma nel mondo ideale la probabilitàlasi assume senza memoria.

Però non capisco come si sia arrivati a questa definizione. Il lancio della moneta classico si ritiene scorrelato dal tiro precedente. Ma perché è così? Ossia, comesi èarrivati a tale definizione e chi mi dice non sia un errore?

Insomma, la probabilità ha un impiego nel mondo reale, quindi non capisco come giustificare questa deifnizione.

ghira1
Magari una moneta vera cambia forma, pochissimo, ogni volta che colpisce una superfice e dopo miliardi di lanci le probabilità cambiano in un modo che dipende dai risultati passati? Non è impossibile. O la moneta si consuma.

ghira1
Nulla ci impedisce di modellare, per esempio, una moneta dove la probabilità di "testa" varia col tempo, la temperatura, i risultati dei lanci passati, il numero di arachidi ad Oslo, ecc. Il modello più semplice è, spero, abbastanza ovviamente quello dove non importa nulla di tutto ciò.

ghira1
E nelle telecomunicazioni, per esempio, modellare gli errori in un flusso di bit come eventi indipendenti non sarebbe realistico.

ghira1
Ma. Detto tutto ciò... per le urne e le monete l'indipendenza sembra ragionevole. Perché non lo sarebbe, secondo te? Se lancio delle monete finché non esca testa 10 volte di fila su ciascuna moneta, per quanto posso venderle, secondo te?

giangianni1
Tutto vero quanto dici, ma io parlo di un caso ideale ove viene dato per assodato dell'indipendernza e non memoria della probabilità: quella che si legge su ogni libro per intenderci.

Rispondendo alla tua domanda del perché non mi sembri ragionevoleè che il limite a infinito farebbe si che la moneta esca 50% di tiri testa e il resto croce. Quindi semprerebbe portare, in modo fallace, a dire che vi sia una correlazione a infiniti lanci e quindi anche in pochi lanci dovrebbe esserci (l'errore che fanno gli scommettitori compulsivi del ritardatario che "deve usicre" per intenderci).

Invece, come dicevo, in ogni libro è dato assodato che siano indipendenti... mi sembra controintuitivo giungere a questa verità per quanto suddetto.

Da qui la domanda: è una definizione che sia indipendente il lancio successivo dal precedente, è dimostrabile, si è giunti empiricamente?

Questi sono i miei dubbi :D

Faussone
Vediamo se questo ti convince.
Supponiamo che per un caso strano, dovuto però solo al caso non ad altro, lanciando 100 volte una moneta, testa sia uscita 80 volte e croce 20, sappiamo però che se lancio tantissime volte le teste e le croci devono essere uguali.
Bene allora supponi che per gli $N$ lanci successivi (con $N$ tendente a infinito) succeda che testa e croce escono come deve essere al 50% ciascuno, e ora considera tutti i lanci, inclusi i 100 iniziali con quelle percentuali strane. Bene se fai il rapporto tra il numero totale di teste (lo stesso vale per le croci ovviamente) e il numero dei lanci totali vedrai che sono ancora pari al 50%.
Per esempio per la percentuale totale di teste si ha:

$lim_{N->\infty} (0.5N+80)/(N+100)=0.5$

Come vedi non occorre che per i lanci successi ai primi 100 ci sia un "recupero" delle croci.

Quindi in ogni lancio puoi assumere che la probabilità che esca testa o croce sia sempre la stessa, basta solo assumere che per tanti lanci sia lecito aspettarsi che il numero di teste e croci sia lo stesso, cioè che la moneta non sia truccata.

giangianni1
Grazie!
Molto intuitivo @Faussone, mi piace :). Non ci avevo proprio pensato.

alifasi
Io invece non ho ben capito quanto dice Fassone, scusatemi.

Non ho capito come inferenziare da quel limite che la probabilità sia la stessa ad ogni lancio, mi spiego:

Anche se non fosse la stessa, mettiamo esca più facilmente testa dopo 10 croci, quel rapporto sarebbe comunque 0.5.

Se anziché essere 80/100 fosse 10001/10000 poiché condizionata la successiva e quindi porta a valori simili, beh sarebbe 0.5 ancora il limite

Non mi sembra cioè giustificare la domanda dell' op

giangianni1
"alifasi":
Io invece non ho ben capito quanto dice Fassone, scusatemi.

Non ho capito come inferenziare da quel limite che la probabilità sia la stessa ad ogni lancio, mi spiego:

Anche se non fosse la stessa, mettiamo esca più facilmente testa dopo 10 croci, quel rapporto sarebbe comunque 0.5.

Se anziché essere 80/100 fosse 10001/10000 poiché condizionata la successiva e quindi porta a valori simili, beh sarebbe 0.5 ancora il limite

Non mi sembra cioè giustificare la domanda dell' op



Hai ragione anche tu :-D

Faussone
@alifasi

Chiariamo cosa quel ragionamento dimostra: se per ipotesi in tutti i lanci ci sia la stessa probabilità $p=0.5$ che esca testa, il che equivale a dire che per un numero $N$ molto molto grande (tendente a infinito) di lanci ci si aspetta che testa esca sempre $N/2$ volte, allora il fatto che in un sottoinsieme di lanci, anche grande (ma non tendente a infinito) , testa sia uscito più volte di croce non autorizza a dire che le volte successive croce debba uscire più frequentemente di testa.

Questo porta a dire che la storia dei lanci precedenti non può influenzare i lanci successivi, nelle ipotesi dette, ciò si intende normalmente quando si dice che ogni lancio è indipendente.

Ovvio che se invece i lanci per loro natura sono influenzati per qualche motivo dai lanci precedenti, quel ragionamento non aiuta, ma la dipendenza di un certo lancio dai lanci precedenti deve essere dovuta a una precisa causa, non discende naturalmente, per cosi dire, dallo storico.

Questo credo chiarisca la domanda iniziale qui, a meno che non abbia colto il significato del dubbio espresso.

giangianni1
Sì certo ora mi è chiaro il ragionamento, ma rileggendo meglio ero giunto a questa conclusione della tua spiegazione.

Resta però il fatto che non capisco bene come dimostrare che l'assunto sia vero, intendo dire la tua spiegazione accende una luce dicendo che se sono in effetti indipendenti il limite non influenza il discorso "alfinito" (passami il termine).
Tuttavia mettiamo vi fosse una correlazione al finito, non capisco come si faccia a essere sicuri non vi sia, il ragioamento non lo metterebbe in mostra.

Infatti come dici tu il limite "non autorizza a dire che le volte successive croce debba uscire più frequentemente di testa", ma nemmeno dimostrerebbe che una correlazione alfinito sia sbagliata a priori (come mostrava alifasi).

Quindi rimane un po' la domanda iniziale: perché si assumono scorrelati? Quale evidenza empirica o meno ha fatto arrivare a questa conclusione?

Faussone
Allora scusami ma non capisco che tipo di risposta tu stia cercando.
Nel caso dell'esempio della moneta è ragionevole e ovvio assumere che ogni lancio è indipendente dai precedenti, se lancio la moneta sempre nello stesso modo. Perché dovrei aspettarmi qualcosa di diverso?

Anzi spesso per individuare anomalie e correlazioni nascoste si fa in un certo senso il contrario di quello che forse chiedi tu. Cioè, per esempio nel caso di una moneta, si guarda una serie e si osserva se presenta qualche comportamento anomalo, quindi si calcola la probabilità che quella anomalia si manifesti per caso, assumendo l'assenza di correlazione e che i lanci siano tutti uguali come dicevamo: tanto più bassa è tale probabilità tanto più è possibile che ci siano correlazioni e comportamenti non casuali e che quindi valga la pena approfondire l'indagine, con ipotesi varie da verificare.
Questo tipo di approccio è la base di qualunque analisi statistica: si usa per verifare se un farmaco è veramente efficace, se un una teoria è valida, se una roulette è truccata ecc ecc

giangianni1
EDIT 20.20


basta solo assumere che per tanti lanci sia lecito aspettarsi che il numero di teste e croci sia lo stesso


E' ragionevole e ovvio assumere che ogni lancio è indipendente dai precedenti


In realtà cercavo una risposta al perché fosse ragionevole questo: che la prob.di ogni lancio sia sempre 0.5. Intendo dire: sì è palese ma è una assunzione che devo fare e se fosse malauguratamente sbagliata fonderei tutto su un qualcoas di errato

Inoltre voglio dire che il limite che mi hai mostrato giustifica bene nell'ipotesi che ogni lancio sia indipendente che un numero finito grandissimo di lanci non influenzi comunque il successivo mantenndo il valore del limite 0.5. In altre parole non è indispensabile, per far valere il limite di 0.5, che ci sia il recupero di teste o croci da un certo punto in poi.
Tuttavia quel limite, ipotizzando per assurdo che sia sbagliato il fatto che ogni lancio è indipendente dal precedente (ipotizziamo che sia stata capita male la natura), sotto tale ipotesi assurda funzionerebbe comunque e farebbe 0.5. Potrei cioè assumere che dopo un tot di croci esce per forza testa e quel limite fa comunque 0.5.
QUindi quel limite mi dice che non è necessaria una dipendenza dei tiri dai precedenti perché converga a quel valore, tuttavia non mi dice nulla sulla correttezza o meno di tale valore. Non è sufficiente valga 0.5 per essere sicuro che ogni tiro è indipendente.

Da qui la domanda del perché sia ragionevole e ovvio assumere che ogni lancio vale0.5 e che con il progredire la sua probabilità non vari se prima sono uscite più teste o più croci, mi chiedo se si una cosa decisa così (una sorta di principio primo/definizione data per certa) o se dimostrabile che la natura funzioni davvero così e non ci si sia sbagliati.

Grazie per le spiegazioni :)

Faussone
Guarda, oltre quello che ti ho detto non ho altro da aggiungere.
Ripeto che, secondo me, stai guardando le cose dal verso sbagliato e non posso fare altro che inviarti a riflettere bene su quanto detto.

Aggiungo solo ancora che, se dopo un certo numero di croci, uscisse sempre testa basterebbe osservare una serie lunga e contare quante volte si presenta quella certa sequenza e rapportarla con la probabilità che ciò possa accadere per puro caso nella ipotesi di indipendenza dei lanci. Esistono strumenti in statistica per fare esattamente quello, si chiama test di significatività dell'ipotesi zero.
Dimostrazioni a priori non esistono e neanche ha senso cercarne.

Detto questo da parte mia chiudo.

Gughigt
Se non ho capito male, tu vuoi una giustificazione formale dell’assenza di memoria (i.e. dell’indipendenza stocastica tra lanci successivi).
Per rendere meglio l’idea, userò la base di un esempio usato da Daniel Bernoulli, noto come “Paradosso di San Pietroburgo“[nota]Che Bernoulli ha utilizzato per mostrare tutt’altro[/nota].
In un ipotetico gioco d'azzardo, derivato dalla scommessa testa o croce sul lancio di una moneta, si paga una quota di ingresso fissa, diciamo A, per partecipare ad una fase del gioco. Ciascuna fase consiste nel lanciare ripetutamente una moneta (non truccata) finché non esce Croce, che dà luogo alla vincita[...]

Definendo $Z$ la v.c. di cui sopra, si può osservare che segue una distribuzione geometrica (il numero di fallimenti precedenti al successo).
$Z~ Geom (p) $

con $p=\frac{1}{2}$ se la moneta è onesta e le stesse condizioni si ripetono ad ogni lancio, è noto che $\mathbb(P)(Z=i)=(1-p)^{i}p$ ($i$ è evidentemente il numero di lancio “corrente”).

Quello che ci interessa dimostrare è che la distribuzione sia caratterizzata da assenza di memoria, formalmente, ci interessa dimostrare la seguente:

$\mathbb(P)(Z=i+j | Z=j)=\mathbb(P)(Z=i)$

Immediatamente:
$\mathbb(P)(Z=i+j | Z=j)=\frac{\mathbb(P)(Z=j | Z=i+j) \mathbb(P)(Z=i+j)}{\mathbb(P)(Z=j)}$

$=\frac{\mathbb(P)(Z=i+j)}{\mathbb(P)(Z=j)}$

$=\frac{(1-p)^{i+j}p}{(1-p)^{j}}$

$=(1-p)^{i}p=\mathbb(P)(Z=i)$
.
c.v.d.
Come vedi la probabilità dell’n-esimo lancio è indipendente da quelle di prima e costante al livello di $p$

Faussone
È una dimostrazione formale che fa vedere che la conoscenza dello storico, se una moneta è non truccata e ha probabilità $p$ di far uscire testa in un singolo lancio, non cambia la probabilità $P$ di vincere a quel gioco al lancio successivo dopo $N$lanci. Secondo me questo è equivalente a quello che gli avevo scritto io, ma è meno immediato da comprendere per chi sta iniziando a vedere i concetti base.

Da come la vedo io è impossibile dimostrare la non dipendenza dalla storico se non si parte dall'ipotesi che in ogni lancio la probabilità di uscita di testa sia data e pari a $p$ e se vale quello è praticamente una tautologia dire che i lanci sono indipendenti e scorrelati. Per questo dicevo che una dimostrazione non esiste

giangianni1
Vorrei ringraziarvi tutti per gli aiuti.

"Faussone":

Da come la vedo io è impossibile dimostrare la non dipendenza dalla storico se non si parte dall'ipotesi che in ogni lancio la probabilità di uscita di testa sia data e pari a $p$ e se vale quello è praticamente una tautologia dire che i lanci sono indipendenti e scorrelati. Per questo dicevo che una dimostrazione non esiste


Esatto, è quello che volevo dire, che se vale sempre 0.5 è praticamente immediato dire che lo storico è scorrelqto al lancio attuale. Era proprio questo che cercavo di capire e soprattutto capire se avevo capito bene che 0.5 a ogni lancio è preso come dato di fatto e così mi pare essere dal tuo scritto :)
Ti vorrei ringraziare e soprattutto spero di non averti tediato con la mia stupidità, sei stato fondamentale per inquadrare il dubbio e capirci qualcosa. Scusa ancora i dubbi scemi

Faussone
@giangianni

Nessun tedio, diciamo che al massimo c'è stata frustrazione per non essere riuscito a toglierti il dubbio nonostante lo sforzo.

In effetti alla fine si tratta di concetti di base per cui non esiste una "dimostrazione", io mi ero concentrato sul farti vedere che non serve un recupero delle croci, nell'esempio della moneta che ti ho fatto, se in una sotto-serie fossero uscite più teste, perché quello è il classico ragionamento errato di chi insegue i cosiddetti ritardi.

Comunque il percorso logico è questo (focalizziamoci sempre sul caso del lancio della moneta tanto per avere un esempio concreto).

1) Si definisce la probabilità $p$ che esca testa come il rapporto tra il numero di teste uscite e il numero di lanci totali con il numero di lanci totali che tende a infinito.
2) Si suppone che ogni lancio sia indipendente dagli altri.
3) Si conclude dai punti precedenti che in ogni singolo lancio di una serie di lanci la probabilità che esca testa è proprio la $p$ definita al punto 1).

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.