Confrontare due distribuzioni campionarie
$ P(X_1 \geq X_2) = \sum_{d \in D} \frac{P(X_1 \geq d)}{n} $Ciao a tutti, è un po' che non lavoro su probabilità e statistica, quindi sono terribilmente arrugginito. Saranno molto gradite correzioni su eventuali strafalcioni e proposizioni insensate 
Ho due distribuzioni campionarie $D_1$ e $D_2$ di $n$ valori discreti relative rispettivamente a due variabili aleatorie $X_1$ e $X_2$, e vorrei confrontarle. Nello specifico, mi interesserebbe sapere la probabilità che $X_1$ sia maggiore o uguale di $X_2$, cioè la probabilità che un valore estratto a caso da $D_1$ sia maggiore uguale di un valore estratto a caso da $D_2$: $P(X_1 \geq X_2)$
Quello che so per certo, è che se volessi probabilità che $X_1$ sia maggiore uguale di un certo valore fisso $k$ ($P(X_1) \geq k$) basterebbe contare il numero di valori in $D_1$ più grandi di $k$ e dividerlo per $n$.
Nel caso di due distribuzioni ho in mente di fare qualcosa di simile: per ogni valore $d \in D_2$, calcolo $P(X_1 \geq d)$, e poi calcolo la media su $n$: $P(X_1 \geq X_2) = \sum_{d \in D} \frac{P(X_1 \geq d)}{n}$.
Ha senso fare qualcosa del genere, o è un po' troppo naïve? Sto implicitamente facendo qualche assunzione (per esempio, di indipendenza) tra variabili?

Ho due distribuzioni campionarie $D_1$ e $D_2$ di $n$ valori discreti relative rispettivamente a due variabili aleatorie $X_1$ e $X_2$, e vorrei confrontarle. Nello specifico, mi interesserebbe sapere la probabilità che $X_1$ sia maggiore o uguale di $X_2$, cioè la probabilità che un valore estratto a caso da $D_1$ sia maggiore uguale di un valore estratto a caso da $D_2$: $P(X_1 \geq X_2)$
Quello che so per certo, è che se volessi probabilità che $X_1$ sia maggiore uguale di un certo valore fisso $k$ ($P(X_1) \geq k$) basterebbe contare il numero di valori in $D_1$ più grandi di $k$ e dividerlo per $n$.
Nel caso di due distribuzioni ho in mente di fare qualcosa di simile: per ogni valore $d \in D_2$, calcolo $P(X_1 \geq d)$, e poi calcolo la media su $n$: $P(X_1 \geq X_2) = \sum_{d \in D} \frac{P(X_1 \geq d)}{n}$.
Ha senso fare qualcosa del genere, o è un po' troppo naïve? Sto implicitamente facendo qualche assunzione (per esempio, di indipendenza) tra variabili?
Risposte
Nessun commento? La diamo per buona? ;D