***interessante*** Densità di probabilità di funzioni non indipendenti
Salve a tutti,
Devo calcolare la funzione di densità di probabilità di una funzione $ F(\DeltaV) $ somma di elementi non indipendenti.
In particolare la funzione è così definita:
$ F(\DeltaV) = \DeltaV - sign(\DeltaV) $
Dove $ \DeltaV $ ha PDF gaussiana con valor medio nullo e deviazione $\sigma$
Sono alquanto impreparato sulla statistica, ed ho molte difficoltà su come procedere.
Vi ringrazio in anticipo,
Michele
Devo calcolare la funzione di densità di probabilità di una funzione $ F(\DeltaV) $ somma di elementi non indipendenti.
In particolare la funzione è così definita:
$ F(\DeltaV) = \DeltaV - sign(\DeltaV) $
Dove $ \DeltaV $ ha PDF gaussiana con valor medio nullo e deviazione $\sigma$
Sono alquanto impreparato sulla statistica, ed ho molte difficoltà su come procedere.
Vi ringrazio in anticipo,
Michele
Risposte
Ho pensato:
Poiché la PDF di $\DeltaV $ è simmetrica, la PDF di $ sign(\DeltaV) $ saranno due delta di area $ 1/2 $ ciascuna, poste in $-1$ e $1$, poichè la probabilità che $\DeltaV $ sia negativa è uguale a quella che $\DeltaV $ sia positiva.
Se fossero state indipendenti la PDF di $ F(\DeltaV) $ sarebbe stata la convoluzione delle due PDF.
Il problema è che le due non sono indipendenti.
Poiché la PDF di $\DeltaV $ è simmetrica, la PDF di $ sign(\DeltaV) $ saranno due delta di area $ 1/2 $ ciascuna, poste in $-1$ e $1$, poichè la probabilità che $\DeltaV $ sia negativa è uguale a quella che $\DeltaV $ sia positiva.
Se fossero state indipendenti la PDF di $ F(\DeltaV) $ sarebbe stata la convoluzione delle due PDF.
Il problema è che le due non sono indipendenti.
EDIT:
Puoi iniziare con la definizione di CDF
$Y=X-sign(X)$
$F_Y(y)=P(Y<=y)=P[X-sign(X)<=y]=$
$=P[X-1<=y|X>0]*P(X>0)+P[X+1<=y|X<0]*P(X<0)=$
$=1/2 P(X<=y+1|X>0)+1/2P(X<=y-1|X<0)$
ecc ecc
Ecco anche un esempio ma con una distribuzione di partenza differente. Seguendo questa dettagliata soluzione, con un piccolo ragionamento aggiuntivo risolvi anche l'esempio della traccia...ti lascio quindi finire il problema in autonomia.
saluti
Puoi iniziare con la definizione di CDF
$Y=X-sign(X)$
$F_Y(y)=P(Y<=y)=P[X-sign(X)<=y]=$
$=P[X-1<=y|X>0]*P(X>0)+P[X+1<=y|X<0]*P(X<0)=$
$=1/2 P(X<=y+1|X>0)+1/2P(X<=y-1|X<0)$
ecc ecc
Ecco anche un esempio ma con una distribuzione di partenza differente. Seguendo questa dettagliata soluzione, con un piccolo ragionamento aggiuntivo risolvi anche l'esempio della traccia...ti lascio quindi finire il problema in autonomia.
saluti
Se fosse una mixture di due gaussiane centrate su 1 e -1 non sarebbe la convoluzione delle due?
quello che mi aspetterei sarebbe qualcosa del genere:
X nel primo istogramma, Y nel secondo:

$ Y=X-sign(X) $
$ F_Y(y)=P(Y<=y)=P[X-sign(X)<=y]= $
$ =P[X-1<=y|X>0]*P(X>0)+P[X+1<=y|X<0]*P(X<0)= $
$ =1/2 P(X<=y+1|X>0)+1/2P(X<=y-1|X<0) $
Nello sviluppo che mi hai fatto, devo ricondurre tutto a P(X) giusto?
quello che mi aspetterei sarebbe qualcosa del genere:
X nel primo istogramma, Y nel secondo:

$ Y=X-sign(X) $
$ F_Y(y)=P(Y<=y)=P[X-sign(X)<=y]= $
$ =P[X-1<=y|X>0]*P(X>0)+P[X+1<=y|X<0]*P(X<0)= $
$ =1/2 P(X<=y+1|X>0)+1/2P(X<=y-1|X<0) $
Nello sviluppo che mi hai fatto, devo ricondurre tutto a P(X) giusto?
@orlac_ : ho visto che ti sei collegato ma non hai più replicato; data la latitanza, non so se sei ancora interessato al problema oppure no...ad ogni modo facciamo un po' di chiarezza sull'argomento delle distribuzioni "Mixture" per eventuali altri utenti interessati al problema...
Partiamo dal caso più semplice di indipendenza fra X e Y, modificando il problema iniziale nel seguente modo:
$X~N(0;1)$
$Y-={{: ( -1 ,1 ),( 1/2 , 1/2 ) :}$
e calcoliamo la distribuzione della variabile $Z=X+Y$
Come accennato, utlizziamo la definizione di distribuzione:
$F_(Z)(z)=P{Z<=z}=P{X+Y<=z}=P{X-1<=z|Y=-1}P(Y=-1)+P{X+1<=z|Y=1}P(Y=1)$
che, in virtù dell'indipendenza fra X e Y, diventa:
$F_(Z)(z)=1/2 P{X<=z+1}+1/2P{X<=z-1}=1/2F_X(z+1)+1/2F_X(z-1)$
In pratica la distribuzione di Z è una mistura (una combinazione lineare) delle due CDF condizionate:
$F_(Z)(z)=P(A)F(X|A)+P(bar(A))F(X|bar(A))$
derivando si ottiene la funzione di densità.
$f_(Z)(z)=1/(2sqrt(2pi))[e^(-1/2(z+1)^2)+e^(-1/2(z-1)^2)]$
Puoi facilmente controllare che tale PDF soddisfa tutte le proprietà caratterizzanti...
Veniamo ora al caso più interessante di variabili NON indipendenti, che poi è il caso dell'esercizio in questione:
$X~N(0;1)$
calcoliamo la distribuzione della variabile
$Y=X-sign(X)$
Innanzitutto osserviamo che anche il dominio di Y è tutto $RR$
Ripercorrendo tutti i passaggi fatti precedentemente (il metodo non cambia per variabili non indipendenti, ma cambierà il risultato...) otteniamo che
$F_(Y)(y)=P{X<=y+1;X>0}+P{X<=y-1;X<0}$
ovviamente per il calcolo delle probabilità congiunte occorre partizionare opportunamente il dominio di Y ed osservare che:
Per $y<-1$ otteniamo
$F_(Y)(y)=P{X<=y-1}=F_(X)(y-1)$
Per $-1
$F_(Y)(y)=P{0
Per $y>1$ otteniamo
$F_(Y)(y)=P{0
Anche qui, derivando, otteniamo la PDF richiesta:
$f_(Y)(y)-={{: ( 1/sqrt(2pi)e^(-1/2(y-1)^2) , ;y<=-1 ),( 1/sqrt(2pi)[e^(-1/2(y-1)^2)+e^(-1/2(y+1)^2)] , ;-11 ) :}$
...e volendo si può verificare che l'integrale su tutto $RR$ faccia uno (e fa uno!).
saluti e spero che qualcuno sia interessato....
Partiamo dal caso più semplice di indipendenza fra X e Y, modificando il problema iniziale nel seguente modo:
$X~N(0;1)$
$Y-={{: ( -1 ,1 ),( 1/2 , 1/2 ) :}$
e calcoliamo la distribuzione della variabile $Z=X+Y$
Come accennato, utlizziamo la definizione di distribuzione:
$F_(Z)(z)=P{Z<=z}=P{X+Y<=z}=P{X-1<=z|Y=-1}P(Y=-1)+P{X+1<=z|Y=1}P(Y=1)$
che, in virtù dell'indipendenza fra X e Y, diventa:
$F_(Z)(z)=1/2 P{X<=z+1}+1/2P{X<=z-1}=1/2F_X(z+1)+1/2F_X(z-1)$
In pratica la distribuzione di Z è una mistura (una combinazione lineare) delle due CDF condizionate:
$F_(Z)(z)=P(A)F(X|A)+P(bar(A))F(X|bar(A))$
derivando si ottiene la funzione di densità.
$f_(Z)(z)=1/(2sqrt(2pi))[e^(-1/2(z+1)^2)+e^(-1/2(z-1)^2)]$
Puoi facilmente controllare che tale PDF soddisfa tutte le proprietà caratterizzanti...
Veniamo ora al caso più interessante di variabili NON indipendenti, che poi è il caso dell'esercizio in questione:
$X~N(0;1)$
calcoliamo la distribuzione della variabile
$Y=X-sign(X)$
Innanzitutto osserviamo che anche il dominio di Y è tutto $RR$
Ripercorrendo tutti i passaggi fatti precedentemente (il metodo non cambia per variabili non indipendenti, ma cambierà il risultato...) otteniamo che
$F_(Y)(y)=P{X<=y+1;X>0}+P{X<=y-1;X<0}$
ovviamente per il calcolo delle probabilità congiunte occorre partizionare opportunamente il dominio di Y ed osservare che:
Per $y<-1$ otteniamo
$F_(Y)(y)=P{X<=y-1}=F_(X)(y-1)$
Per $-1
$F_(Y)(y)=P{0
Per $y>1$ otteniamo
$F_(Y)(y)=P{0
Anche qui, derivando, otteniamo la PDF richiesta:
$f_(Y)(y)-={{: ( 1/sqrt(2pi)e^(-1/2(y-1)^2) , ;y<=-1 ),( 1/sqrt(2pi)[e^(-1/2(y-1)^2)+e^(-1/2(y+1)^2)] , ;-1
...e volendo si può verificare che l'integrale su tutto $RR$ faccia uno (e fa uno!).
saluti e spero che qualcuno sia interessato....
@ tommik: Grazie mille, sei stato di grande aiuto!! Purtroppo non ho grandi conoscenze in statistica, e non sapevo come affrontare il problema!