Probabilita' combinata

KLorenzo
Ciao a tutti, il problema che vorrei risolvere e' questo.

Ho una prima distribuzione di "casi" in funzione dell'eta' che chiamo A (in blu). Ho poi una seconda distribuzione supposta indipendente di nuovo in funzione dell'eta', che chiamo B (in arancione).





Quello che vorrei trovare e' che quota di B rientra anche nel caso A.

La mia idea e', una volta che ho le due gaussiane normalizzate, di fare l'intersezione dei due integrali, in verde, e poi rapportare quest'area all'intera area di B.

Intuitivamente sembra ragionevole. E' troppo semplice? Mi sfugge qualche dettaglio?

Grazie

Risposte
Lo_zio_Tom
"KLorenzo":


La mia idea e', una volta che ho le due gaussiane normalizzate, di fare l'intersezione dei due integrali, in verde,



l'unione, cioè la somma delle due probabilità

$int_(-infty)^x f_(B)(b)db+int_x^(+infty)f_(A)(a)da$


dove $x$ è l'ascissa dell'intersezione fra le due gaussiane mentre $f_A$ e $f_B$ sono le due densità gaussiane

"KLorenzo":


...e poi rapportare quest'area all'intera area di B.


...che è uno...quindi non serve

KLorenzo
Ciao tommik e grazie per la risposta.

Non capisco come mai fai l'unione delle due curve che, in generale, da' un risultato superiore a 1. Io sto cercando il sottoinsieme dei casi B che rientrano nei casi A quindi mi aspetto un valore minore di 1 (al piu' uguale nel caso le distribuzioni coincidano).

Si', rapportarlo all'area di B, che vale 1, non cambia il valore numerico, ma concettualmente vado a guardare la proporzione tra le due aree.

Lo_zio_Tom
se rifletti un attimo su come ho scritto i due integrali vedi che dovresti convincerti...







...che la probabilità cercata è la somma delle due aree colorate

Ora se mi spieghi come faccia, variando $x in \mathbb(R)$, quell'area colorata ad essere maggiore di uno te ne sarei grato.

-----------------------------------------

Ovviamente potresti anche avere un caso così





in qual caso la probabilità sarebbe la somma di 3 integrali

KLorenzo
Ho capito, non avevo fatto caso che nella formula il primo termine e' fB e poi fA, invertiti rispetto alla sequenza con cui ero abituato a pensare le due curve.

E quando parlavi di unione sembrava in contrapposizione alla mia intersezione e che quindi ti riferissi alle intere curve cosi' come facevo io.

Chiarito l'equivoco, quindi mi confermi che il ragionamento e' corretto? E che quindi basta calcolare l'integrale dell'intersezione delle due distribuzioni.

Il mio dubbio e' se il ragionamento, semplicissimo, sia corretto da un punto di vista statistico.

Poi la parte di calcolo e' semplice.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.