Valor atteso e binning
Data una variabile casuale continua $ x $, caratterizzata da una nota distribuzione di densità di probabilità $ p(x) $, si supponga di effettuare un campionamento di $ x $ e di rappresentare gli $ N $ valori ottenuti in un istogramma. Fissato un bin, indichiamo con $ a $ e $ b $ gli estremi dell'intervallo che ne fa da base. Per definizione di $ p(x) $, la probabilità che un'acquisizione di $ x $ fornisca un valore compreso tra $ a $ e $ b $ è:
$ P(a,b)= \int_{a}^{b} p(x)\ dx $
L'analogo sperimentale di tale probabilità è fornito dalla frequenza relativa. Detto $ N_i $ il numero di acquisizioni di $ x $ che forniscono valori contenuti nel bin fissato:
$ f(a,b)=\frac{N_i}{N} $
$ N_i $ è a sua volta una variabile casuale (discreta).
Senza conoscere a priori la distribuzione caratteristica di $N_i$, perchè ci si aspetta che il valore atteso $\barN_i$ sia tale da verificare la seguente relazione
$ \frac{\barN_i}{N}=\int_{a}^{b} p(x)\ dx $ ?
A posteriori, sapendo che $N_i$ segue una distribuzione binomiale con valore atteso $ \barN_i=NP(a,b) $ tutto torna, ma a priori come posso giustificare la relazione precedente?
$ P(a,b)= \int_{a}^{b} p(x)\ dx $
L'analogo sperimentale di tale probabilità è fornito dalla frequenza relativa. Detto $ N_i $ il numero di acquisizioni di $ x $ che forniscono valori contenuti nel bin fissato:
$ f(a,b)=\frac{N_i}{N} $
$ N_i $ è a sua volta una variabile casuale (discreta).
Senza conoscere a priori la distribuzione caratteristica di $N_i$, perchè ci si aspetta che il valore atteso $\barN_i$ sia tale da verificare la seguente relazione
$ \frac{\barN_i}{N}=\int_{a}^{b} p(x)\ dx $ ?
A posteriori, sapendo che $N_i$ segue una distribuzione binomiale con valore atteso $ \barN_i=NP(a,b) $ tutto torna, ma a priori come posso giustificare la relazione precedente?
Risposte
"TS778LB":
Per definizione di $ p(x) $, la probabilità che un'acquisizione di $ x $ fornisca un valore compreso tra $ a $ e $ b $ è:
$ P(a,b)= \int_{a}^{b} p(x)\ dx $
E se lo fai $N$ volte?
Dovrei elevare alla $N$ la $P(a,b)$ in quanto eventi statisticamente indipendenti
Riflettendoci credo che non sia come ho detto. Sembrerebbe più plausibile che la probabilità venga moltiplicata per $N$. Però sapevo che le probabilità si sommano quando gli eventi sono mutuamente escludentesi e non è il caso delle acquisizioni di $x$....
Sfruttando le definizione presenti nel link che mia postato, posso riscrivere l'uguaglianza in questo modo:
$ \frac{\sum_{N_i=0}^N N_iP(N_i)}{N}=\int_{a}^{b}p(x)dx $
però continuo a non capire perchè ci si aspetta tale uguaglianza? Quello che si vuole è che l'area del bin sia uguale a quella sotto la curva $ p(x) $ nell'intervallo considerato. Ma perchè tale area è proprio $ \frac[\barN_i}{N} $? Un altro modo con cui ho pensato di risolvere è sfruttare la linearità del valor atteso. In particolare:
$ \frac[\barN_i}{N}=\bar((N_i/N))=\barf=P $ dove $ \barf $ è il valor atteso della frequenza relativa. E' corretto dire che il valor atteso della frequenza relativa è la probabilità?
E se lo fai $ N $ volte?[/quote]
A proposito di questa domanda, qual è la risposta? Non riesco a capacitarmene.
Grazie
$ \frac{\sum_{N_i=0}^N N_iP(N_i)}{N}=\int_{a}^{b}p(x)dx $
però continuo a non capire perchè ci si aspetta tale uguaglianza? Quello che si vuole è che l'area del bin sia uguale a quella sotto la curva $ p(x) $ nell'intervallo considerato. Ma perchè tale area è proprio $ \frac[\barN_i}{N} $? Un altro modo con cui ho pensato di risolvere è sfruttare la linearità del valor atteso. In particolare:
$ \frac[\barN_i}{N}=\bar((N_i/N))=\barf=P $ dove $ \barf $ è il valor atteso della frequenza relativa. E' corretto dire che il valor atteso della frequenza relativa è la probabilità?
"ghira":
[quote="TS778LB"]Per definizione di $ p(x) $, la probabilità che un'acquisizione di $ x $ fornisca un valore compreso tra $ a $ e $ b $ è:
$ P(a,b)= \int_{a}^{b} p(x)\ dx $
E se lo fai $ N $ volte?[/quote]
A proposito di questa domanda, qual è la risposta? Non riesco a capacitarmene.
Grazie
"ghira":
[quote="TS778LB"]Per definizione di $ p(x) $, la probabilità che un'acquisizione di $ x $ fornisca un valore compreso tra $ a $ e $ b $ è:
$ P(a,b)= \int_{a}^{b} p(x)\ dx $
E se lo fai $N$ volte?[/quote]
Ho studiato un po’ di cose in giro in rete e sono arrivato alla conclusione che se facessi $ N $ acquisizione la probabilità di ottenere un valore nell’intervallo considerato resta sempre $ P(a,b)= \int_{a}^{b} p(x)\ dx $. Analogamente se lancio una moneta 100 volte, la probabilità di ottenere testa è sempre $ 1/2 $.
$E(X+Y)=E(X)+E(Y)$. Anche se non sono indipendenti. Tutto qui.
E questa proprietà come potrebbe aiutarmi nel dubbio che ho? Dove compare il valore atteso di una somma di variabili?
"TS778LB":
E questa proprietà come potrebbe aiutarmi nel dubbio che ho? Dove compare il valore atteso di una somma di variabili?
https://it.wikipedia.org/wiki/Funzione_indicatrice o se preferisci https://it.wikipedia.org/wiki/Distribuz ... _Bernoulli