Esercizio sulla mutua informazione

stefano8612
"Si disponga di due dadi a 6 facce: uno normale con le facce da 1 a 6 e uno con le facce da 1 a 3, ovvero un dado dove ciascun numero 1, 2 e 3 compare su due facce.
Si scelga casualmente uno dei due dadi e lo si lanci due volte consecutive.
Considerando $D$ (dado scelto) e $P$ (numero di facce con numero pari uscite nei due lanci), calcolare $I(D;P)$."

So che la mutua informazione è:
$I(X;Y)=\sum_x \sum_y p(x,y) \log \frac{p(x,y)}{p(x)p(y)} = H(X)-H(X|Y) = H(Y)-H(Y|X)$
ma non come applicarla al problema.

Posso scrivere $D$ come:
\begin{pmatrix}
dado1 & dado2\\
\frac{1}{2} & \frac{1}{2}
\end{pmatrix}

E ora come procedo?

Grazie infinite

Risposte
Lo_zio_Tom
Non mi sembra complicato.

Dalla seguente tabella ricavi sia le probabilità congiunte che marginali.






Ora non ti resta che applicare la formula.

ciao

stefano8612
Ciao, grazie per la risposta. Potresti dirmi come hai ottenuto quei valori? Scusa ma io e la statistica/probabilità non andiamo per nulla d'accordo.

Lo_zio_Tom
E' una tabella a doppia entrata dove nell'ultima riga e colonna si leggono le distribuzioni marginali. Una è quella che hai identificato anche tu....la probabilità di scegliere fra dado equo e non equo è sempre $1/2$

all'interno della tabella vi sono le probabilità congiunte che vanno calcolate una per una con la formula $P(A nn B)=P(A)P(B|A)$, dato che gli eventi non sono indipendenti

Ad esempio: probabilità di scegliere il dado non equo e contemporaneamente di avere un numero pari su due lanci è:



$1/2\cdot((2),(1))\cdot2/6\cdot4/6=2/9$

ecc ecc

poi ho espresso tutto con un denominatore comune per facilitare la lettura della tabella


spero sia chiaro

stefano8612
"tommik":
E' una tabella a doppia entrata dove nell'ultima riga e colonna si leggono le distribuzioni marginali. Una è quella che hai identificato anche tu....la probabilità di scegliere fra dado equo e non equo è sempre $1/2$

all'interno della tabella vi sono le probabilità congiunte che vanno calcolate una per una con la formula $P(A nn B)=P(A)P(B|A)$, dato che gli eventi non sono indipendenti

Ad esempio: probabilità di scegliere il dado non equo e contemporaneamente di avere un numero pari su due lanci è:



$1/2\cdot((2),(1))\cdot2/6\cdot4/6=2/9$

ecc ecc

poi ho espresso tutto con un denominatore comune per facilitare la lettura della tabella


spero sia chiaro


Mmmh non ancora :oops:
In quel caso hai usato la formula $P(A nn B)=P(A)P(B|A)$ per trovare $P(D=non equo nn B=1)=P(D=non equo)P(B=1|D=non equo)$ e suppongo che $1/2$ sia $P(D)$ mentre gli altri termini ($((2),(1))$,$2/6$,$4/6$) cosa rappresentano?
Grazie

Lo_zio_Tom
Rappresentano la probabilità di k successi su n prove. Nel caso specifico la probabilità di avere un Pari su due lanci con il dado non equo (P=pari; O=dispari)

PO +OP=$2/6 4/6+ 4/6 2/6=4/9$

Io ho usato la distribuzione binomiale

$ P (X=k)=((n), (k)) p^k (1-p)^(n-k) $

ma puoi farlo anche così.

stefano8612
Seguendo il tuo ragionamento ho provato a calcolare:
$P(D=non equo, P=0) = P(D=non equo)P(D=non equo | P = 0) = (1/2)\cdot(OO + OO) = (1/2)\cdot(2OO) = OO = (4/6)\cdot(4/6) = 4/9 \ne 16/72$

Dove sto sbagliando?

Lo_zio_Tom
$1/2 4/6 4/6=2/9=16/72$

essendoci 2 dispari su due lanci è un unico caso, non va moltiplicato per due. Basta pensare a tutti i casi possibili. Lanciando il dado due volte puoi ottenere solo 4 casi

OO
OP
PO
PP

tra l'altro tutti equiprobabili, nel caso di dado equo.

stefano8612
Giusto, era facile da capire.
Ultima cosa (spero). Ho completato la tabella e ora devo trovare la mutua informazione.
Volendo usare la formula:
$ I(D;P) = H(P)-H(P|D) $
So che $H(P)=-25/72 \log_2(25/72) - 17/36 \log_2(17/36)-13/72 \log_2(13/72) \cong 1.486 $
Mentre per trovare $H(P|D)$? Arrivo a questo punto e poi mi blocco:
$H(P|D)=\sum_d p(D) H(P|D=d) = $
E adesso?
Grazie mille per l'aiuto che mi stai dando

Lo_zio_Tom
"stefano86":

Volendo usare la formula:
$ I(D;P) = H(P)-H(P|D) $


La mutua informazione si può calcolare con entrambe le formule.
Questa non è molto diversa dall'altra; per calcolare l'entropia condizionale devi calcolare la distribuzione condizionata; se hai capito come calcolare la congiunta non dovresti avere problemi in questa. Altrimenti puoi consultare qualunque testo elementare di Statistica dove trovi tutto spiegato nei dettagli.

"stefano86":
...Scusa ma io e la statistica/probabilità non andiamo per nulla d'accordo.


magari con un bel ripasso fate pace!


ciao

stefano8612
Penso di aver risolto l'esercizio.

$I(D;P) = H(D)-H(D|P)$
$H(D)=1$
$H(D|P) = Pr(P=0)H(D|P=0) + Pr(P=1)H(D|P=1) + Pr(P=2)H(D|P=2)$

$H(D|P=0) = -P(D=e | P=0) \logP(D=e | P=0) -P(D=non | P=0) \logP(D=non | P=0) = -1/8 \log(1/8)-2/9 \log (2/9) \cong 0.857$

$H(D|P=1) = -P(D=e | P=1) \logP(D=e | P=1) -P(D=non | P=1) \logP(D=non | P=1) = -1/4 \log(1/4)-2/9 \log (2/9) \cong 0.982$

$H(D|P=2) = -P(D=e | P=2) \logP(D=e | P=2) -P(D=non | P=2) \logP(D=non | P=2) = -1/8 \log(1/8)-1/18 \log (1/18) \cong 0.606$

quindi

$H(D|P) = Pr(P=0)0.857 + Pr(P=1)0.982 + Pr(P=2)0.606 = 25/72 * 0.857 + 16/72 * 0.982 + 13/72 * 0.606 \cong 0.870 $

ed infine

$I(D;P) = H(D)-H(D|P) = 1- 0.870 = 0.13$

Potrebbe essere giusto? Ovviamente avrei ottenuto lo stesso risultato usando la formula $I(D;P) = H(P)-H(P|D)$

Lo_zio_Tom
no, non mi torna per nulla.

la mutua informazione si può calcolare così (uso la tua formula del primo post)


$I(X,Y)=sum_(x)sum_(y)p(x,y)log_(2)[(p(x,y))/(p(x)p(y))]$

utlizzando la tabella che ti ho spiegato, il calcolo di $I(D,P)$ viene fuori in 2 secondi e mezzo ed è il seguente:



$I(D,P)=0,04$


se proprio non ti piace allora utilizziamo l'altra formula


$I(D,P)=H(D)-H(D|P)$

$H(D|P)=H(D,P)-H(P)$

Ora, considerando anche che

$H(X)=-sum_(x)p(x)log_(2)p(x)$

$H(X,Y)=sum_(x)sum_(y)p(x,y)log_(2)(1/(p(x,y)))$

con la stessa facilità costruisco le ulteriori tabelle ottenendo lo stesso risultato per la mutua informazione




stefano8612
"tommik":

utlizzando la tabella che ti ho spiegato, il calcolo di I viene fuori in 2 secondi e mezzo ed è il seguente:



I=0,04

se proprio non ti piace allora utilizziamo l'altra formula

No no, a me piace. Vorrei solo capirla.
I nuovi valori (-0.06, 0.08, 0.02, ...) come si ottengono e cosa sarebbero?

stefano8612
Comunque ho rifatto i calcoli usando la formula $I(D;P)=H(D)+H(P)-H(D,P)$ ed ottengo $0.04$. Però non capisco perchè il mio ragionamento di prima non andasse bene..

Lo_zio_Tom
"stefano86":
I nuovi valori (-0.06, 0.08, 0.02, ...) come si ottengono e cosa sarebbero?


sono semplicemente gli addendi di questa formula...una volta nota la distribuzione congiunta non ti serve altro....

$I(X,Y)=sum_(x)sum_(y)p(x,y)log_(2)[(p(x,y))/(p(x)p(y))]$



$-0.06=0.13log_(2)((0.13)/(0.35\cdot0.50))$

ecc ecc


con excel ci vuole un minuto ad impostare tutte le formule


stefano8612
Grazie, sei stato gentilissimo!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.