Probabilità sieropositivi
In una popolazione la percentuale dei sieropositivi è dell 0.2%. Il test diagnostico dà risultato corretto nel 95% dei casi se il soggetto è malato, e risultato corretto nel 90% dei casi se il soggetto è sano. Qual'è la probabilità che una persona risultata positiva al test sia malata.
Il problema si risolve con il teorema di Bayes però non ho capito come applicarlo, qualcuno me lo può spiegare?
Il problema si risolve con il teorema di Bayes però non ho capito come applicarlo, qualcuno me lo può spiegare?
Risposte
Una persona può essere sana oppure malata. Indichiamo con $M$ l'evento "la persona è malata" e con $S$ l'evento la persona è sana. Il testo ci fornisce la probabilità che una persona sia malata, cioè $P(M)$. Conosciamo quindi anche la probabilità che una persona sia sana dato che è l'evento complementare di $M$: $P(S)=1-P(M)$.
Il test può fornire due soli esiti: Positivo (cioè riscontra la malattia nella persona) o negativo ( non viene riscontrata la malattia ).
Ci vengono date le probabilità che il test dia risultato positivo sapendo che la persona è malata e che il test dia risultato negativo sapendo che la persona è sana. Cioè, detti $T_p$ e $T_n$ gli eventi "il test da esito positivo" e "il test da esito negativo", conosciamo $P(T_n | S)$ e $P(T_p | M)$.
Viene richiesta $P(M|T_p)=P(M nn T_p)/(P(T_p))= . . .$ Riesci ad andare avanti ora ? Si tratta di sostituire quanto trovato.
Nota che conoscendo $P(T_n \ S)$, è possibile conoscere anche $P(T_p | S)$. Stesso dicasi per $P(T_p |M)$.
Il test può fornire due soli esiti: Positivo (cioè riscontra la malattia nella persona) o negativo ( non viene riscontrata la malattia ).
Ci vengono date le probabilità che il test dia risultato positivo sapendo che la persona è malata e che il test dia risultato negativo sapendo che la persona è sana. Cioè, detti $T_p$ e $T_n$ gli eventi "il test da esito positivo" e "il test da esito negativo", conosciamo $P(T_n | S)$ e $P(T_p | M)$.
Viene richiesta $P(M|T_p)=P(M nn T_p)/(P(T_p))= . . .$ Riesci ad andare avanti ora ? Si tratta di sostituire quanto trovato.
Nota che conoscendo $P(T_n \ S)$, è possibile conoscere anche $P(T_p | S)$. Stesso dicasi per $P(T_p |M)$.
I passaggi di Relegal sono corretti però i possibili risultati del test sono quattro e non due e mi sembra indispensabile conoscere $P(Tp|S)$ per risolvere l'esercizio ma, almeno a prima vista, non riesco a ricavarlo dai dati che abbiamo. Notare che $P(Tp|S)+P(Tp|M)$ in generale è diverso da $1$, ed anche passando per il teorema delle probabilità totali comparirebbe $P(Tp)$ quindi avremo un'equazione in 2 incognite. Come ricavare $P(Tp|S)$
Il test può avere due esiti: Positivo o negativo.
Sono invece quattro gli accoppiamenti possibili con esito del test e stato di salute di una persona. ( test positivo + persona sana, test positivo + persona malata, test negativo + persona sana, test negativo + persona malata. )
Se si conosce la probabilità condizionata $P(T_n|S)$ allora, poichè il test può avere due soli esiti, $P(T_p|S)=1-P(T_n|S)$ dato che gli eventi sono l'uno il complementare dell'altro.
Dato uno spazio di probabilità $(\Omega, f,P)$ e un evento $Ain \Omega$, la funzione $P_(|A): \Omega->[0;1]$ definita da $P_(|A)(\omega):=P(\omega|A)$ è ancora una misura di probabilità.
Dovrebbe essere giusto così, qualcosa non ti torna ?
Sono invece quattro gli accoppiamenti possibili con esito del test e stato di salute di una persona. ( test positivo + persona sana, test positivo + persona malata, test negativo + persona sana, test negativo + persona malata. )
Se si conosce la probabilità condizionata $P(T_n|S)$ allora, poichè il test può avere due soli esiti, $P(T_p|S)=1-P(T_n|S)$ dato che gli eventi sono l'uno il complementare dell'altro.
Dato uno spazio di probabilità $(\Omega, f,P)$ e un evento $Ain \Omega$, la funzione $P_(|A): \Omega->[0;1]$ definita da $P_(|A)(\omega):=P(\omega|A)$ è ancora una misura di probabilità.
Dovrebbe essere giusto così, qualcosa non ti torna ?
Guarda non voglio avventurarmi in definizioni troppo da matematico perchè non le mastico molto, sono un "praticaccio" non un matematico quindi non saprei trovare agevolmente l'errore.
Però ti posso dire che un paio di anni fa ho sostenuto un esame dove in un esercizio si presentava un problema analogo a questo dove però usando la notazione che abbiamo qui avevo $P(Tp|M)=0,95$ e $P(Tp|S)=0,04$ e per il resto bastava applicare la formula di Bayes (quella dove si esplicita l'intesezione con il condizionamento). Il fatto che non sommassero ad 1 ha mandato in panico non poche persone.
Non credo che fosse un errore (anche se non ho i dettagli della correzzione per vari motivi). Adesso concettualmente se facciamo il test questo può veder bene le malattie nel senso che può non sfuggirgliene nessuna ovvero $P(Tp|M)=1$ non sarebbe assurdo che lo stesso test potrebbe confondere alcuni sintomi irrilevanti per rilevanti, quindi $P(Tp|S)>0$.
La chiave nell'insoddisfacenza del test stava prorprio nel fatto che $P(Tp|S)=0,04$ che può sembrare bassa è in realtà troppo alta perchè "agisce" sui sani che sono quasi il 100%.
Però ti posso dire che un paio di anni fa ho sostenuto un esame dove in un esercizio si presentava un problema analogo a questo dove però usando la notazione che abbiamo qui avevo $P(Tp|M)=0,95$ e $P(Tp|S)=0,04$ e per il resto bastava applicare la formula di Bayes (quella dove si esplicita l'intesezione con il condizionamento). Il fatto che non sommassero ad 1 ha mandato in panico non poche persone.
Non credo che fosse un errore (anche se non ho i dettagli della correzzione per vari motivi). Adesso concettualmente se facciamo il test questo può veder bene le malattie nel senso che può non sfuggirgliene nessuna ovvero $P(Tp|M)=1$ non sarebbe assurdo che lo stesso test potrebbe confondere alcuni sintomi irrilevanti per rilevanti, quindi $P(Tp|S)>0$.
La chiave nell'insoddisfacenza del test stava prorprio nel fatto che $P(Tp|S)=0,04$ che può sembrare bassa è in realtà troppo alta perchè "agisce" sui sani che sono quasi il 100%.
Guarda quest'esempio:
prob. prendere l'estratto all'otto (giocando il 5) $P(5)=1/90$
prob. prendere l'estratto condizionatamente al fatto che è stato estratto un multiplo di 5 o il 5 stesso $P(5|M5)=1/18$
prob. prendere l'estratto condizionatamente al fatto che non è stato estratto un multiplo di 5 o il 5 stesso $P(5|noM5)=0$
da cui $P(5|M5)+P(5|noM5)=1/18<1$
prob. prendere l'estratto all'otto (giocando il 5) $P(5)=1/90$
prob. prendere l'estratto condizionatamente al fatto che è stato estratto un multiplo di 5 o il 5 stesso $P(5|M5)=1/18$
prob. prendere l'estratto condizionatamente al fatto che non è stato estratto un multiplo di 5 o il 5 stesso $P(5|noM5)=0$
da cui $P(5|M5)+P(5|noM5)=1/18<1$
Forse ho fatto confusione fra evento condizionante ed evento condizionato
Si è così ha ragione Relegal dovevo leggere più attentamente ho fatto confusione.
Penso che sia proprio questo l'errore. Nel nostro caso, non stiamo modificando l'evento condizionante (l'essere sano ) ma l'evento condizionato (l'esito del test).
Nell'esempio che hai riportato invece si fa il contrario, tieni fisso l'evento condizionato (giocare il 5) e modifichi l'evento condizionante (uscita o meno di un multiplo di 5)
Nell'esempio che hai riportato invece si fa il contrario, tieni fisso l'evento condizionato (giocare il 5) e modifichi l'evento condizionante (uscita o meno di un multiplo di 5)
"markowitz":
Si è così ha ragione Relegal dovevo leggere più attentamente ho fatto confusione.
è un attimo fare confusione, quante volte mi è capitato ! ;P
Si si è così ho fatto confusione. Comunque se ho fatto bene i conti $P(M|Tp)<2%$ quindi troppo bassa il problema anche in questo caso sta nel fatto che il test "riconosce bene i malati" ma scambia per malati troppi sani.
"markowitz":
Si si è così ho fatto confusione. Comunque se ho fatto bene i conti $P(M|Tp)<2%$ quindi troppo bassa il problema anche in questo caso sta nel fatto che il test "riconosce bene i malati" ma scambia per malati troppi sani.
Il risultato che da il libro è 0.01868 quindi dovrebbe essere corretto.
Relegal e markowita grazie per le vostre risposte, avete chiarito i miei dubbi. Quello che avevo sbagliato nel calcolo era mettere al denominatore la probabilità che la persona era sana moltiplicata per la probabilità che quella persona al test fosse risultata negativa, mentre dovevo mettere la probabilità che fosse risultata positiva

Prego, se sostituisci i valori completando i passaggi che ho riportato all'inizio dovrebbe venire giusto. Se così non dovesse essere prova a trascrivere i tuoi conti e vediamo quale errore è occorso !
A risentirci, buono studio !
A risentirci, buono studio !

"Relegal":
Prego, se sostituisci i valori completando i passaggi che ho riportato all'inizio dovrebbe venire giusto. Se così non dovesse essere prova a trascrivere i tuoi conti e vediamo quale errore è occorso !
A risentirci, buono studio !
Nessun problema torna alla perfezione e grazie ancora per i chiarimenti

Perfetto, alla prossima allora, buona serata !