Riguardo la definizione di Probabilità Condizionata

luca661
Buonasera ragazzi, vi scrivo per risolvere un dubbio su la definizione di Probabilità Condizionata.

A livello puramente intuitivo ho capito benissimo cosa si intende per \(\displaystyle P(A|B) \), ma onestamente non riesco a capire la definizione formale:
Da dove viene questa relazione ?
\(\displaystyle P(A|B)=P(A \cup B)/P(A) \)

Viene per caso per far ritornare questo fatto intuitivo?
\(\displaystyle P(A|B)=(P(A)P(B))/P(B)=P(A) \) , Dati \(\displaystyle A , B \) indipendenti


Se così fosse comunque non andrebbe dimostrato che quella formula vale in generale ?

Risposte
gugo82
"luca66":
A livello puramente intuitivo ho capito benissimo cosa si intende per \(\displaystyle P(A|B) \), ma onestamente non riesco a capire la definizione formale:
Da dove viene questa relazione ?
\(\displaystyle P(A|B)=P(A \cup B)/P(A) \)

Hai sbagliato a scrivere la definizione. Quella corretta è:
\[
P(B|A):= \frac{P(A\cap B)}{P(A)}\; .
\]

La definizione semplicemente vuol dire che la probabilità che si verifichino $A$ e $B$ contemporaneamente, ossia la probabilità di $A cap B$, è proporzionale alla probabilità di $A$; la costante di proporzionalità rappresenta una probabilità, precisamente quella che si verifichi l'evento $B$ sapendo che si è già verificato $A$, e si denota con $B|A$.

gio73
Ciao luca66
dici di aver capito perfettamente la probabilità condizionata
io invece faccio sempre un sacco di fatica con questo concetto
Hai degli esempi, dei problemini, da proporre?
Mi piacerebbe mettermi alla prova

luca661
Allora rispondo prima gugo82:
Si hai ragione scusami tanto, è stato un errore di battitura. Potresti spiegarti meglio riguardo il termine proporzionale? Potrebbe essere una domanda elementare, ma al momento mi sfugge. Di conseguenza scusami ma non sono stato in grado di capire appieno la tua spiegazione, potresti riscriverla in un modo diverso?

Gio73 ti rispondo:
Molto semplicemente la probabilità condizionata ti chiede, quale è la probabilità che un evento B si verifichi sapendo che l'evento A è accaduto?
Ti propongo due problemi molto semplici e assolutamente intuitivi:
1) data un urna contenente 5 palline numerate da uno a 5, sapendo che è uscita la pallina numero 1 quale è la probabilità che esca la pallina numero 2?

Quindi la probabilità che ti sto chiedendo è : \(\displaystyle P("Esce 2"|"esce 1")=\) 1/4

2) Abbiamo un dado equilibrato. Ti chiedo quale è la probabilità che esca 2 sapendo che è uscito 1 ?
Ti sto chiedendo P("Esce 2"|"esce 1")=1/6 e non 1/5 perché i due eventi sono Indipendenti, l'uno non influenza l'altro!

gio73
ciao luca
ti propongo il seguente problema:
Il signor Rossi sospetta di essere affetto da una rara (un caso ogni 100 000 persone) malattia genetica.
Si sottopone dunque a un test, la cui affidabilità è deol 99%, e risulta positivo.
Qual è la probabilità che il signor Rossi non abbia la malattia?

Lo_zio_Tom
anche io vorrei proporre il mio esercizio a luca66:

Sia $Y$ la variabile casuale che rappresenta il diametro di un perno e $X$ la variabile casuale che rappresenta il diametro interno della sede dove il perno deve essere inserito. Come da disegno tecnico, il perno dovrebbe avere un diametro di $9.95 mm$ mentre la sede un diametro di $10.00 mm$. Per motivi legati al processo di produzione entrambi gli oggetti non sono perfetti ma hanno una certa tolleranza. Supponiamo quindi che di fatto $Y~ U(9.85;10.05)$ mentre $X~ U(9.90;10.10)$ e supponiamo inotre che il perno possa essere correttamente inserito e funzionare bene solo se $X-0.1 Posto che le variabili $X$ e $Y$ sono indipendenti qual è la probabilità che il perno sia correttamente accoppiato con la sua sede?

luca661
Allora rispondo a gio73:
Immagino che la domanda del testo sia "Qual è la probabilità che il signor Rossi non abbia la malattia dopo aver fatto il test?"
Per la legge delle probabilità totali abbiamo:
\(\displaystyle P("malato")=P(["Test positivo" \cap "malato"] \cup ["test negativo" \cap "malato"])= \)

quindi la probabilità prevede sia il caso in cui si è malati ma il test sia negativo sa il caso in cui si è malat e il test ha avuto successo!

otteniamo quindi con semplici calcoli e soprattutto grazie a Bayes ciò:

=\(\displaystyle P(["malato"|"Test positivo" ]*P("malato") \cup ["malato"|"test negativo"])*P("malato") \)
\(\displaystyle = 99/100 *1/100000 + 1/100*1/100000 = 1*10^{-5}\)

Ma noi cercavamo la probabilità che non sia malato quindi \(\displaystyle 1-P("malato") \), ricorda che il complementare si trova sempre nella sigma-algebra per assioma.

\(\displaystyle 1-P("malato")=0,99999 \); questa è la probabilità cercata

Spero che per la fretta non mi sia sfuggito nulla.


Per quanto riguarda tommik, ho analizzato il suo problema giungo a tale soluzione:

Date \(\displaystyle X -0,1
quindi basta calcolarsi la probabilità tenendo conto che y e x devono assumere solo i valori che rispettano questa disuguaglianza. Non continuo perché sono molto sicuro che le due variabili Aleatorie sono intese come continue, siccome le continue le sto studiando da circa una settimana non mi sento in grado di continuare l'esercizio e fornirti una risposta valida. Scusami.

Ragazzi comunque attendo ancora una risposta al mio dubbio :') :idea:

Lo_zio_Tom
Ovviamente sono entrambi errati. L'esercizio proposito da @gio73 chiede di calcolare una probabilità condizionata: $P["sano"|"test"^+]$ e non la probabilità di essere sano che ovviamente è $(99.999)/(100.000)$ essendo ciò già scritto nei dati del problema.

Sempre utilizzando bayes, la probabilità cercata è

$P["sano"|"test"^+]=(0.01xx99.999)/(0.99xx1+0.01xx99.999)=0.999$

Il mio esercizio è pure sulla probabilità condizionata... ma se ancora non hai fatto del distribuzioni continue (sono due uniformi) .... come non detto

Per calcolare la probabilità cercata si può utilizzare il teorema di bayes (anzi il denominatore della nota formula di bayes)

$P[X-0.1
Ecc ecc

Esistono tuttavia anche altre strade...


luca661
Non capisco il vostro fine ...
Ovviamente sono entrambi errati.

Ovviamente cosa ? Non dobbiamo esaminarci mica qui o sbaglio? Se questi due test sono stati fatti per non fiducia sulla mia affermazione "ho capito molto bene il significato di probabilità condizionata", potevate direttamente dirlo.
Onestamente c'è poco da impicciarsi con la condizionata eccetto testi e problemi mal posti e avvolte soggettivi.


È logico che il primo esercizio di Giò può essere interpretato in svariati modi, non è chiaro il testo. Oppure è stata la mia una lettura troppo superficiale.
Io ho calcolato la probabilità di essere malato dopo aver fatto il test

Lo_zio_Tom
@luca: Mi spiace che tu abbia mai interpretato le mie parole, la prossima volta che scriverai eviterò accuratamente di intervenire.
Ciò premesso, il quesito di @gio73 è chiaro: tizio fa il test e risulta positivo...quindi è una probabilità condizionata, ovvero ristretta ai casi di test positivo .. l'altro se sei all'inizio dello studio della materia non puoi saperlo fare.

Addio.


@gio73: come vedi al numeratore ho messo la probabilità che i 99.999 individui sani abbiano avuto un test positivo ( cioè errato) mentre al denominatore la probabilità totale di avere test positivi...ovvero il numeratore + l'altro caso, cioè quello che l'unico individuo malato abbia il test positivo.

Fammi sapere se la questione così è più chiara... all'inizio ti può essere utile redigere la tabellina che ti ho indicato in pm

Ciao ciao

luca661
Assolutamente io ho piacere che tu come qualsiasi altra persona in questo forum possa rispondere ai miei messaggi, mi scuso in più per l'atteggiamento. Vomunqje Non mi era piaciuta solo questa modalità di risposta. Sicuramente ho sbagliato io entrambi gli esercizi, però comunque penso che se affermo di aver capito qualcosa e quindi di conseguenza mi serviva un'altra delucidazione, non vedo il motivo per il quale dovete dubitare ciò che dico di aver capito. Di certo non voglio prendere in giro nessuno né tantomeno me stesso, so benissimo autocriticarmi fortunatamente :")

luca661
Tommik spero si chiarisca questa situazione totalmente indesiderata da me. Sono stato troppo superficiale nell'analizzare il problema, ho sbagliato sicuramente io.

Sto anche provando a scriverti un messaggio privato, ma mi dice che non esisti..

axpgn
Perché tommik è un'entità superiore ... :D

Lo_zio_Tom
Faccenda chiarita....ad ogni modo l'esercizio che ho proposto secondo me è molto interessante, originale ed istruttivo...se qualcuno ha voglia di farlo...

luca661
Chiedo scusa ai lettori per questa situazione.

se qualcuno ha voglia di farlo

Appena avrò le competenze per farlo, ne terrò conto!

gio73
Ciao Luca
non ho preso in giro
ho davvero difficoltà con questo argomento

luca661
Mi scuso anche con te gio, scusa anche se ho risposto in modo sbagliato al tuo quesito. Più tardi gli darò un occhiata così capiro anche io dove ho sbagliato!

luca661
Ho riletto ora il testo, ho toppato alla grande. Non ha senso quello che ho scritto. Non è per fare oramai la parte, ma effettivamente è cosi.

Lo_zio_Tom
"luca66":
...scusa anche se ho risposto in modo sbagliato al tuo quesito.


adesso non esagerare....non vi è assolutamente nulla di male nello sbagliare....anzi, a volte è proprio sbagliando che ci si confronta e si comprendono meglio determinati meccanismi.

Ora, dato che il problema si ripropone ciclicamente, vediamo di fare un po' di chiarezza sul tema. A tal proposito riscrivo l'esercizio proposto da @gio73 rendendolo più aderente alla realtà di questi test diagnostici.

Definiamo prima di tutto alcune quantità che si usano spesso in epidemiologia

1) Prevalenza: è la percentuale di morbosità: una stima della percentuale dei malati

2) Sensibilità del test: è la probabilità che un malato risulti positivo al test: $P[T^+|M]$

3) Specificità del test: è la probabilità che un individuo sano risulti negativo al test: $P[T^-|S]$

4) Valore Predittivo Positivo: è la probabilità di essere effettivamente malato dato che ho avuto un test positivo: $VPP=P[M|T^+]$

Ovviamente un buon test è un test per il quale Sensibilità e Specificità sono molto elevati.

Ora riscriviamo l'esercizio in maniera più standard, per renderlo più elastico:



La prevalenza di una certa malattia nella popolazione è dell'1 per 1000. Per diagnosticare la malattia si usa un test diagnostico con i seguenti parametri: Sensibilità 96% e Specificità 94%
Tizio si sottopone al test e risulta positivo. Qual è la probabilità che sia davvero malato?



Per risolvere il problema è di utilità fondamentale conoscere il teorema di bayes ma, dato che la questione, almeno all'inizio, può generare problemi, suggerisco di procedere nel seguente modo:

Costruiamo una tabella (che in realtà è la distribuzione bivariata discreta) con i valori assoluti, prendendo cioè una popolazione di N individui....nel caso in esame ho considerato la popolazione composta da 100 mila persone che si sottopongono al test.

con i dati del problema otteniamo la seguente distribuzione (suddivisione) di tutta la popolazione:




Come si costruisce la tabella:


molto semplicemente, si parte dal totale della popolazione (numero in basso a destra) e si calcola la prevalenza:

$100.000 xx 0.001=100$, l'altro valore per differenza.

Ora veniamo al "corpo" della tabella:

- numero di individuidi malati e contemporaneamente positivi al test: $0.96xx100=96$....il valore sotto, 4, per differenza

- numero di individui sani e contemporaneamente negativi al test: $0.94xx 99.900=93.906$...il valore sopra, 5.994, per differenza.

I totali, che rappresentano le distribuzioni delle variabili marginali, sono la somma per riga e per colonna dei dati della tabella.

Fatta la tabella abbiamo risolto tutto perché ora, con tutta la distribuzione, possiamo rispondere a qualsivoglia domanda. Es: qual è la probabilità di essere davvero malati se il test è risultato positivo.....basta fare : numero di individui Malati&Positivi diviso il totale dei positivi: $96/(6.090)=1.6%$

Questo risultato, apparentemente eclatante, sta ad indicare che, per avere una certa "credibilità" non basta che il suddetto test sia molto affidabile (come in questo caso) ma è necessario che venga applicato ad una popolazione con una prevalenza elevata della malattia....infatti supponiamo ora di avere il medesimo test fatto ad una popolazione con una prevalenza del 40% ed otteniamo subito:



Con il medesimo test, qui il VPP è del 91%.

Ovviamente, per avere un VPP alto anche nel primo caso, la soluzione è fare più test. Il valore predittivo positivo si calcola nel medesimo modo, tenendo presente che i test sono fra loro indipendenti e si ottiene subito (supponendo che tutti i test diano esito positivo):

$VPP=(0.96^n xx100)/(0.96^n xx100+0.06^n xx 99.900)={1.6%;20.4%;80.4%;98.5%}_(n=1,2,3,4)$


Nell'esercizio proposto da @gio73 il tutto è estremizzato: il test è molto affidabile, avendo Sensibilità e Specificità pari al 99% ma la prevalenza di 1 a 100.000 lo rende del tutto inutilizzabile, dato che fornisce un $VPP~~0$

...Facile come bere un bicchiere :drinkers: .... di Guinness

(spero di aver chiarito meglio il problema a tutti gli interessati)

^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
Questo invece:
Sia $Y$ la variabile casuale che rappresenta il diametro di un perno e $X$ la variabile casuale che rappresenta il diametro interno della sede dove il perno deve essere inserito. Come da disegno tecnico, il perno dovrebbe avere un diametro di $9.95 mm$ mentre la sede un diametro di $10.00 mm$. Per motivi legati al processo di produzione entrambi gli oggetti non sono perfetti ma hanno una certa tolleranza. Supponiamo quindi che di fatto $Y~ U(9.85;10.05)$ mentre $X~ U(9.90;10.10)$ e supponiamo inotre che il perno possa essere correttamente inserito e funzionare bene solo se $X-0.1 Posto che le variabili $X$ e $Y$ sono indipendenti qual è la probabilità che il perno sia correttamente accoppiato con la sua sede?


ricordando la generalizzazione del denominatore del teorema di bayes

$p(x)=int_(theta in Theta)pi(theta)p(x|theta)d theta$

dopo qualche conto....otteniamo


$P[X-0.1
Per ragioni che si capiranno una volta fatte le trasformazioni vettoriali di variabili aleatorie, il problema ha anche una interessante interpretazione geometrica



per cui la probabilità richiesta è pari all'area grigia (che a dispetto del disegno è un esagono simmetrico rispetto alla bisettrice) per la densità congiunta di $X,Y$ ovvero

$P[X-0.1

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.