Sensibilità e specificità di un test

fbafkis
Salve,
ho un dubbio su un esercizio che ho risolto. Premetto che ci è stato detto che possiamo avere dei risultati impossibili, per via dei dati sbagliati del testo. Questo è il testo:

A causa di un pericoloso parassita originario della costa Atlantica del sud America, le relazioni commerciali tra Cile e Argentina sono sottoposte a controlli continui in fase di importazione. In particolar modo, i prodotti di origine vegetale vengono testati per assicurarsi che il parassita non si diffonda anche nel paese confinante. Sui prodotti di questo tipo provenienti dalle regioni a rischio dell'Argentina viene effettuato un test specifico di controllo. Sebbene questo test fornisca una certezza assoluta sull'assenza del parassita (la specificità del test è 100%), è possibile che a volte individui dei falsi positivi al test (ovvero è possibile che il test affermi la presenza del parassita quando il parassita in realtà non è presente: la probabilità che il test sia positivo quando effettivamente abbiamo la patologia è chiamata sensibilità e nel caso di questo test assume il valore 1.105977). Sapendo che 87 su cento prodotti, provenienti dalle regioni a rischio dell'Argentina, contengono il parassita, calcolare:


    [*:1mtgccyu]La probabilità che il test dia risposta positiva.[/*:m:1mtgccyu]
    [*:1mtgccyu]La probabilità che il prodotto sia effettivamente infettato dal parassita quanto otteniamo una risposta positiva del test.[/*:m:1mtgccyu][/list:u:1mtgccyu]


Ho dato dei nomi agli eventi e trasformato le informazioni del testo in probabilità:

    [*:1mtgccyu]$M="La merce è infetta (malata)"$ e $Pr(M)=0,87$[/*:m:1mtgccyu]
    [*:1mtgccyu]$M^{C}="La merce non è infetta"$ e $Pr(M^{C})=1-0,87=0,13$[/*:m:1mtgccyu]
    [*:1mtgccyu]$P="Il test è positivo"$ e $N="Il test è negativo"$[/*:m:1mtgccyu]
    [*:1mtgccyu]$"Specificità" = {N|M^{C}}$ e $Pr(N|M^{C})= 1$ [/*:m:1mtgccyu]
    [*:1mtgccyu]$Pr(P|M^{C})=1-"Specificità"=0$[/*:m:1mtgccyu]
    [*:1mtgccyu]$"Sensibilità"={P|M}$ e $Pr(P|M)=1,105977$[/*:m:1mtgccyu][/list:u:1mtgccyu]


      [*:1mtgccyu]Per rispondere al primo quesito ho utilizzato il teorema delle probabilità totali:

      $Pr(P)= Pr(P|M)*Pr(M)+Pr(P|M^{C})*Pr(M^{C}) = 1,105977*0,87+0=0,96219999$
      [/*:m:1mtgccyu]
      [*:1mtgccyu]Il dubbio principale ce l'ho sul secondo quesito, ma forse la mia incertezza è giustificata dal fatto che la specificità valga 1. Per calcolare $Pr(M|P)$ mi è sembrato ovvio usare la formula di Bayes, ottenendo però un risultato uguale a 1 (ovviamente, dato l'annullamento del secondo addendo nell'operazione sopra):

      $Pr(M|P)=(Pr(P|M)*Pr(M))/(Pr(P)) = (1,105977*0,87)/(0,96219999)=1$

      [highlight]Il mio grosso dubbio è sopratutto riguardo alla seconda risposta, in quanto la probabilità dovrebbe essere minore di 1 (per via dei falsi positivi). Tuttavia visto che la sensibilità è maggiore di 1, è possibile questo risultato?[/highlight][/*:m:1mtgccyu][/list:u:1mtgccyu]

      Grazie mille dei pareri e dell'aiuto!

Risposte
Lo_zio_Tom
la risposta è molto semplice. I dati non sono coerenti. I risultati che trovi (probabilità che il test sia positivo ed il Valore Predittivo Positivo, VPP) sono numericamente corretti ma inutili.

La coerenza è un principio fondamentale del calcolo delle probabilità. Per dimostrarne l'incorerenza basta fare (anche qui....) una bella tabellina dettagliata della distribuzione bivariata



come vedi verrebbe una probabilità congiunta negativa in un caso....cosa che non è assolutamente coerente con gli assiomi della probabilità.

Se provassi a calcolare ad esempio il Valore Predittivo Negativo del test, ovvero $P("Sano"|T^-)$ otterresti circa 3.44 che evidentemente è un risultato impossibile......

Se sei interessato sul forum ci sono diversi esercizi sul principio di coerenza

ciao

fbafkis
Ok, grazie mille, come pensavo. Oggi ci ha ridato il problema, questa volta formulato correttamente, ma anche diversamente:

Si calcola che il 15% dei gatti di una regione sia portatore di un virus pericoloso per l'uomo. I gatti vengono sottoposti a un test che presenta un certo margine di insicurezza, nel senso che esso dà reazione positiva sia nel 97% dei gatti portatori sia nel 6% dei gatti sani (non portatori). Un gatto viene sottoposto al test:


    [*:3uf0ojia]Determinare la probabilità di una reazione negativa del test.[/*:m:3uf0ojia]
    [*:3uf0ojia]Sapendo che la reazione è stata negativa, determinare la probabilità che esso sia, in realtà, portatore.[/*:m:3uf0ojia][/list:u:3uf0ojia]


Ho pensato di risolverlo in questa maniera, simile a quella dell'esercizio sopra, ma considerando alcuni eventi come complementari, e non so se è giusto:

$Pr(M)=0,15$
$Pr(M^{C})=1-0,15=0,85$
$Pr(P|M)=0,97$
$Pr(N|M)=1-0,97=0,03$
$Pr(P|M^{C})=0,06$
$Pr(N|M^{C})=1-0,06=0,94$


    [*:3uf0ojia]Per risolvere il primo quesito ho pensato di interpretare $Pr(N)$, cioè la probabilità che in generale il test sia negativo, come $Pr(N)=1-Pr(P)$, ovvero come complementare del risultato positivo del test, sempre in generale. Quindi ho prima calcolato $Pr(P)$, come nell'altro esercizio, usando la probabilità totale:

    $Pr(P)=Pr(P|M)*Pr(M)+Pr(P|M^{C})*Pr(M^{C})=0,1455+0,051=0,19655$

    Quindi $Pr(N)=1-0,19655=0,8035$.
    [/*:m:3uf0ojia]
    [*:3uf0ojia]Il secondo quesito, in maniera analoga al secondo punto dell'esercizio sopra, l'ho risolto usando la formula di Bayes, disponendo di $Pr(N|M)$, ricavata considerando l'evento come complementare di $Pr(P|M)$ perchè il test in qualsiasi caso (sia di effettiva che falsa infezione) può essere solo o positivo o negativo:

    $Pr(M|N)=(Pr(N|M)*Pr(M))/(Pr(N))= (0,03*0,15)/(0,0835)=0,0056$[/*:m:3uf0ojia][/list:u:3uf0ojia]

    Il mio dubbio sta nella validità della mia considerazione degli eventi che mi mancavano come complementari di altri che invece mi forniva il testo.

    Grazie infinite per le risposte!

Lo_zio_Tom
tutto a posto, come sempre =D>

Se utilizzassi la tabellina che ti ho mostrato ieri, non avresti nemmeno dubbi riguardo al risultato....



nella fattispecie ho considerato una popolazione di 10.000 gatti in modo da non avere le virgole di mezzo....

e le soluzioni sono davvero immediate ora (e puoi rispondere immediatamente anche a moltissime domande....perché in questo modo hai scritto TUTTA la distribuzione bivariata)

$P("TestPositivo")=1965/10000=19.65%$

$P("Malato"|"TestNegativo")=45/8035=0.56%$

ecc ecc

fbafkis
Fantastico, grazie! Finalmente sto cominciando a capire qualcosa di probabilità :-D

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.