Cittadini Italiani e del Mondo

MrEngineer
Ciao ragazzi apro un altro topic con un esercizio sulle probabilità. Credo di aver risolto i vari punti ma vorrei conferma se possibile dei ragionamenti (che sono diversi rispetto alle soluzioni indicate anche se il risultato finale sembra coincidere).
L'esercizio è il seguente:

"In Italia ci sono $82882$ cittadini che hanno cognome Rossi e $34685$ che hanno cognome Bianchi. Assumendo che in Italia vi siano $55 * 10^6$ abitanti e nel mondo $6 * 10^9$ abitanti e che di essi l’$1%$ si chiami di cognome Bianchi e lo $0.5%$ si chiami Rossi, preso a caso un cittadino del mondo avente un singolo cognome, si valuti:

1) la probabilità che sia un cittadino italiano e non si chiami Bianchi
2) la probabilità che sia un cittadino italiano e si chiami Rossi o Bianchi
3) la probabilità che, dato per certo che si chiami Bianchi, sia italiano
4) la probabilità che, dato per certo che non sia italiano, si chiami Rossi
5) la probabilità che, dato per certo che non si chiami Rossi, non sia italiano. "

Risoluzione
Procediamo come sempre ad indicare eventi e probabilità. Abbiamo:
$R = {"cittadino di cognome Rossi"}$
$B = {"cittadino di cognome Bianchi"}$
$I = {"cittadino italiano"}$
$M = {"abitante del mondo"}$

Dal testo si evince che:
$P(I) = (55*10^6)/(6*10^9) = 11/1200$

$P(M) = 1 - P(I) = 1189/1200$

$P(B|M) = 1%$

$P(R|M) = 0.5%$

Poi ho inteso, dalla frase "In Italia ci sono $82882$ cittadini che hanno cognome Rossi" che
$P(R|I) = 1.51 * 10^(-3)$ e, analogamente, dalla frase "...$34685$ che hanno cognome Bianchi" che
$P(B|I) = 6.31*10^(-4)$. Quello che un pò mi puzza è proprio questo passaggio, in quanto questi valori li ho ottenuti sfruttando sostanzialmente la definizione classica di probabilità, dividendo cioè il numero totale di cittadini italiani di cognome Rossi / Bianchi per il numero totale di abitanti italiani.

Andando avanti arriviamo al punto 1.
Ho calcolato questa probabilità tenendo conto che:
$P(\overline(B)|I) = (P(\overline(B),I))/(P(I))$ da cui si ottiene che $P(\overline(B),I) = P(\overline(B)|I) *P(I) = [1-P(B|I)]*P(I) = 0.916%$
($0.91%$ in base alle soluzioni del testo, pertanto sembra corrispondere).

Per il punto 2, ho tenuto conto del fatto che i due eventi sono mutualmente esclusivi, ovvero ho tenuto conto del fatto che un cittadino si possa chiamare o Rossi o Bianchi e che ovviamente non possa avere entrambi i cognomi ( Nobili a parte :lol: ). Pertanto ho calcolato:
$P(R \cup B) = P(R) + P(B)$ che ho sostanzialmente ottenuto sommando la definizione sicuramente impropria di $P(R|I) + P(B|I)$. Pertanto $P(R \cup B) = 2.14 * 10^(-3)$ circa.
La probabilità richiesta l'ho infine calcolata sfruttando l'indipendenza statistica, ovvero sfruttando il fatto che il cittadino di cognome Rossi o Bianchi non debba per forza essere italiano. Pertanto ho calcolato che $[P(R \cup B)]*P(I) = 1.96 * 10^(-5)$ ($0.0019%$ secondo il testo, e anche questo sembra coincidere).

Al punto 3, ho applicato Bayes:
$P(I|B) = (P(B|I)*P(I))/(P(B))$ dove $P(B) = P(B|M)*P(M) + P(B|I)*P(I) = 9.91*10^(-3)$ circa. Pertanto
$P(I|B) = 5.83*10^(-4)$ ($5.78*10^(-4)$ secondo il testo, qui la mia soluzione si discosta un pochino).

Per il punto 4 si procede ovviamente tramite Bayes ma ho una domanda: se l'evento condizionante è il non essere italiano, ovvero l'essere un cittadino del mondo, la probabilità che si chiami rossi non essendo italiano non è già fornita comodamente dal testo? Ovvero non è quella probabilità che io ho indicato come $P(R|M) = 0.5% $ ? (infatti corrisponde allo $0.503%$ secondo le soluzioni).

Il punto 5,infine, l'ho risolto ancora una volta tramite Bayes:
$P(\overline(I)|\overline(R)) = (P(\overline(R)|\overline(I))*P(\overline(I)))/(P(\overline(R))) = ([1-P(R|M)]*P(M))/([1-P(R)]) = 0.9908 = 99.08%$$ (coincide con la soluzione del testo).


Aiutatemi a mettere un pò di chiarezza, complice un testo un pò ingarbugliato credo che i miei pensieri siano giusti ma, secondo me, ho sicuramente indicato impropriamente le probabilità (specie quelle condizionate).

Risposte
Lo_zio_Tom
Ovviamente va tutto bene, aldilà di un piccolo refuso (0.0578% e non 0.5% nel punto 3)

Se ti abituassi a scrivere i dati con una tabellina (che poi è una distribuzione bivariata) ti accorgeresti della semplicità della soluzione (che si riduce ad una divisione per ogni richiesta) e vedresti la correttezza della soluzione.

Ad esempio, il punto 3) diventa semplicemente $34685/(6xx10^7)=0.0578%$



Visto che facciamo Statistica, un aggiornamento dei dati ogni tanto si rende anche necessario: in Italia abbiamo abbondantemente superato i 60 milioni mentre al mondo siamo a circa 7.5 miliardi[nota]e dei quali circa 1 miliardo si chiamano Chang[/nota].

Giusto per fare un po' di pratica con un esercizio simile ma leggermente più interessante, guarda questo

MrEngineer
"tommik":
Ovviamente va tutto bene, aldilà di un piccolo refuso (0.0578% e non 0.5% nel punto 3)


Quindi ho indicato correttamente le probabilità condizionate relative ai Rossi e ai Bianchi in Italia? Pensavo di aver sbagliato qualcosa. Per quanto riguarda il refuso, deriva dal fatto che non ho calcolato il valore esatto tramite Bayes avendo supposto che la probabilità di avere cittadini non italiani e di cognome Rossi corrispondesse alla probabilità $P(R|M) = 0.5%$ già fornita dal testo. Per quanto riguarda l'esercizio sull'HIV provo a dargli un'occhiata adesso!

MrEngineer
"tommik":

Un test anti HIV è caratterizzato nel modo seguente: la probabilità di avere un Falso Positivo (ovvero la probabilità che il test risulti positivo se l'individuo è sano) è pari al 6%. La probabilità di avere un Falso Negativo (ovvero la probabilità che il test risulti negativo se l'individuo è malato) è del 4%.
Sapendo che l'incidenza degli individui malati nel totale della popolazione è del 2 per mille, calcolare la probabilità che un individuo sia davvero malato nelle ipotesi che abbia effettuato uno oppure due test e tutti siano risultati positivi.


Alla luce dei risultati cosa possiamo dire circa la politica di effettuare test di massa su tutta la popolazione per la patologia in oggetto? E se invece lo stesso test di massa fosse effettuato sulla popolazione carceraria in un penitenziario nella città di Yaoundé (Camerun) dove il tasso di ospiti malati è del 48% cosa cambierebbe?


$P = {"test positivo"}$
$N = {"test negativo"}$
$S = {"individuo sano"}$
$M = {"individuo malato"}$

$P(P|S) = 0.06$
$P(N|M) = 0.04$
$P(M) = 2*10^(-3)$
$P(S) = 1 - P(M) = 0.998$

Ho calcolato tramite Bayes la probabilità che l'individuo, dato per certo che sia risultato positivo, fosse malato. In particolare:
$P(M|P) = (P(P|M)*P(M))/(P(P)) = 0.031$ dove $P(P)$ è stata calcolata tramite il teorema delle probabilità totali.

Questa probabilità si riferisce al fatto che l'individuo sia malato essendo il test positivo, ma non si fa riferimento in questo caso al numero di volte in cui il test è stato effettuato. Il resto della richiesta non mi è molto chiaro. Forse devo applicare la distribuzione di Bernoulli?

MrEngineer
Grazie Tommik per gli spunti che via via mi fornisci!
Per quanto riguarda la Statistica Bayesiana, lo scopo del corso di Teoria dei Segnali è studiare appunto la trasmissione dei segnali, con una piccola parentesi (di cui ancora ignoro le motivazioni) sulla probabilità. Di conseguenza non è un vero e proprio corso di statistica, ho studiato il teorema di Bayes e come applicarlo congiuntamente al teorema della probabilità totale ma nient'altro, quindi le mie conoscenze sono limitate a questo ahimè!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.