Distribuzione gaussiana
Salve,
Ho letto un problema di questo tipo sul libro:
La quantità di alluminio giornaliera prodotta da una fabbrica è una variabile aleatoria normale con $mu=10000kg$ e $sigma=1500kg$. E poi fa delle richieste sulle varie probabilità degli eventi.
Il mio dubbio è, che senso porre come variabile aleatoria normale una quantità che non può essere negativa?
Mi spiego meglio, se io calcolo la probabilità che produco meno di un kg di alluminio facendo l'integrale della densità di probabilità in $I=(-oo,-1)$, ottengo banalmente qualcosa di maggiore di $0$. Però va contro il buon senso, non sarebbe meglio porre una densità di probabilità del tipo $p_X=f(x)$, e nulla in $(-oo,0)$?
Ho letto un problema di questo tipo sul libro:
La quantità di alluminio giornaliera prodotta da una fabbrica è una variabile aleatoria normale con $mu=10000kg$ e $sigma=1500kg$. E poi fa delle richieste sulle varie probabilità degli eventi.
Il mio dubbio è, che senso porre come variabile aleatoria normale una quantità che non può essere negativa?
Mi spiego meglio, se io calcolo la probabilità che produco meno di un kg di alluminio facendo l'integrale della densità di probabilità in $I=(-oo,-1)$, ottengo banalmente qualcosa di maggiore di $0$. Però va contro il buon senso, non sarebbe meglio porre una densità di probabilità del tipo $p_X=f(x)$, e nulla in $(-oo,0)$?
Risposte
e che c'entra? la variabile gaussiana è una variabile simmetrica (e unimodale) rispetto alla media. stop....può essere solo positiva, solo negativa oppure sia negativa che positiva....dipende dov'è la media e quanto è lo scarto....
in generale, il campo di variazione dei quantili di una normale varia da $mu+-3 sigma$
ad esempio, supponiamo di dover misurare la lunghezza di un oggetto: per quanto io usi uno strumento preciso, la misura vera non la conoscerò mai....dato che varia anche rispetto alle condizioni di temperatura, umidità ecc ecc
Però una cosa è certa:
errori più piccoli sono più probabili di errori grandi
errori positivi hanno la stessa probabilità di errori negativi
mettendo su un grafico queste informazioni trovi proprio una distribuzione a forma di "campana", ovvero una distribuzione più o meno normale....
Anche nel caso in esame la gaussiana va benissimo...la produzione media è di 10 tons, con uno scarto tipo, in più o in meno, di 1.5 tons. Ipotizzando una distribuzione normale significa che il campo di variazione della produzione andrà da $5.5
in generale, il campo di variazione dei quantili di una normale varia da $mu+-3 sigma$
ad esempio, supponiamo di dover misurare la lunghezza di un oggetto: per quanto io usi uno strumento preciso, la misura vera non la conoscerò mai....dato che varia anche rispetto alle condizioni di temperatura, umidità ecc ecc
Però una cosa è certa:
errori più piccoli sono più probabili di errori grandi
errori positivi hanno la stessa probabilità di errori negativi
mettendo su un grafico queste informazioni trovi proprio una distribuzione a forma di "campana", ovvero una distribuzione più o meno normale....
Anche nel caso in esame la gaussiana va benissimo...la produzione media è di 10 tons, con uno scarto tipo, in più o in meno, di 1.5 tons. Ipotizzando una distribuzione normale significa che il campo di variazione della produzione andrà da $5.5

No un attimo, non ho capito.
Dunque ho $p_X=1/(sigma sqrt(2pi)) e^(-(x-mu)^2/(2sigma^2))$
Se io calcolo $P=int_(-oo)^(-1) p_X dx$, questa non è la probabilità che io produca meno di -1kg di alluminio?
E poi in che senso può essere sia negativa che positiva, a me sembra a segno costante una volta fissati $(mu,sigma)$.
L'esempio del righello mi è chiarissimo, infatti l'errore di misurazione può essere in ambo i lati.
Dunque ho $p_X=1/(sigma sqrt(2pi)) e^(-(x-mu)^2/(2sigma^2))$
Se io calcolo $P=int_(-oo)^(-1) p_X dx$, questa non è la probabilità che io produca meno di -1kg di alluminio?
E poi in che senso può essere sia negativa che positiva, a me sembra a segno costante una volta fissati $(mu,sigma)$.
L'esempio del righello mi è chiarissimo, infatti l'errore di misurazione può essere in ambo i lati.
Sì ma viene zero.... Devi considerare il dominio della variabile...
Se nel caso in esame la variabile è $N(10.000; 1.500^2)$
se calcoli $int_(5.500)^(14.500)f(x)dx=0.9973~~ 1$
quindi vedi bene che non può andare a valori negativi....
Puoi fare tutte le prove che vuoi...anche con excel, dove tutte le principali distribuzioni sono ormai tabulate
la probabilità che la tua produzione sia $P<=1000=9.9*10^(-10)$
Se nel caso in esame la variabile è $N(10.000; 1.500^2)$
se calcoli $int_(5.500)^(14.500)f(x)dx=0.9973~~ 1$
quindi vedi bene che non può andare a valori negativi....
Puoi fare tutte le prove che vuoi...anche con excel, dove tutte le principali distribuzioni sono ormai tabulate
la probabilità che la tua produzione sia $P<=1000=9.9*10^(-10)$
Ora mi è più chiaro.
Se per esempio l'esercizio mi chiede di calcolare la probabilità che produco meno di $11.000kg$, allora la risposta corretta sarebbe $P=int_(5.500)^(11.000) p_X dx$ ?
Se per esempio l'esercizio mi chiede di calcolare la probabilità che produco meno di $11.000kg$, allora la risposta corretta sarebbe $P=int_(5.500)^(11.000) p_X dx$ ?
no[nota]ovviamente anche calcolato come vorresti fare tu otterresti lo stesso risultato ma il procedimento è un altro[/nota]. ti ho detto 5500 più o meno per farti capire
Per rispondere al quesito devi calcolare
$F_X(11000)=Phi((11000-10000)/1500)=Phi(0.667)~~74.75%$
perché ovviamente l'integrale viene calcolato tutto, anche per le parti infinitesime....e quindi è sempre
$F_(X)(x)=int_(-oo)^(x)f(t)dt$
anche se la distribuzione in esame è questa:

Per fare i calcoli su qualunque distribuzione gaussiana la si riconduce alla Gaussiana Standard, di media zero e varianza uno.
Per rispondere al quesito devi calcolare
$F_X(11000)=Phi((11000-10000)/1500)=Phi(0.667)~~74.75%$
perché ovviamente l'integrale viene calcolato tutto, anche per le parti infinitesime....e quindi è sempre
$F_(X)(x)=int_(-oo)^(x)f(t)dt$
anche se la distribuzione in esame è questa:
Click sull'immagine per visualizzare l'originale

Per fare i calcoli su qualunque distribuzione gaussiana la si riconduce alla Gaussiana Standard, di media zero e varianza uno.
Va bene, allora qualcosa avevo capito.
La funzione di ripartizione però è definita in $RR$, se calcolo tipo $F(-1)>0$ dal punto di vista formale ha senso, ma dal punto di vista "probabilistico" no perchè non ricade in un dominio soglia che ho definito. Se ho capito bene...
PS: Grazie comunque, mi hai aiutato un sacco!
La funzione di ripartizione però è definita in $RR$, se calcolo tipo $F(-1)>0$ dal punto di vista formale ha senso, ma dal punto di vista "probabilistico" no perchè non ricade in un dominio soglia che ho definito. Se ho capito bene...
PS: Grazie comunque, mi hai aiutato un sacco!
$F(-1)>0$ non ha senso come espressione.... F è sempre $>=0$ per definizione
F infatti è caratterizzata così:
$F(-oo)=0$
$F(+oo)=1$
$d/(dx)F_X=f(x)>=0 AAx$
Nel nostro caso $F(-oo)~~F(4000)~~3.2*10^(-5) $ è già considerabile pari a zero
F infatti è caratterizzata così:
$F(-oo)=0$
$F(+oo)=1$
$d/(dx)F_X=f(x)>=0 AAx$
Nel nostro caso $F(-oo)~~F(4000)~~3.2*10^(-5) $ è già considerabile pari a zero
Il dubbio è che non capisco come fa a venire $0$. E' definita come integrale di una funzione continua e positiva su tutto $RR$, dal punto di vista "formale" dovrebbe essere maggiore di 0. Poi sul fatto che è un valore piccolissimo e trascurabile sono d'accordo.
EDIT: ah ecco tu quindi affermi che è zero perchè è trascurabile a fini di utilizzo
EDIT: ah ecco tu quindi affermi che è zero perchè è trascurabile a fini di utilizzo