Distribuzione normale in \(\displaystyle \Re^+\)
Buongiorno, volevo chiedere se qualcuno sa se è mai stata presa in considerazione una "trasformazione" della distribuzione normale volta a confinare il suo dominio in \(\displaystyle \Re^+ \). Ovvero se qualche altra distribuzione risulta, in qualche caso particolare, avere un andamento a ciò riconducibile.
Mi chiedo ciò per 2 motivi:
1) alcune variabili fisiche hanno un dominio definito nel semiasse positivo (ovvero solo in questo insieme hanno un "senso fisico"). Per il teorema del limite centrale se un sistema avesse solo variabili con queste caratteristiche la loro composizione potrebbe essere comunque descritta (male probabilmente) da una distribuzione normale. Ovviamente si potrebbero usare altre distribuzioni (come la Rayleigh o altre) ma magari non sono quelle migliori.
2) ho provato a costruire una distribuzione che ricorda per struttura matematica la d. normale ma è definita in \(\displaystyle \Re^+ \) ma magari è cosa già nota solo che io non la conosco.
Qualcuno ha informazioni in merito e che vuole condividere? O semplicemente gli và di intavolare un discorso su queste cose?
Un saluto a tutti e grazie!
Mi chiedo ciò per 2 motivi:
1) alcune variabili fisiche hanno un dominio definito nel semiasse positivo (ovvero solo in questo insieme hanno un "senso fisico"). Per il teorema del limite centrale se un sistema avesse solo variabili con queste caratteristiche la loro composizione potrebbe essere comunque descritta (male probabilmente) da una distribuzione normale. Ovviamente si potrebbero usare altre distribuzioni (come la Rayleigh o altre) ma magari non sono quelle migliori.
2) ho provato a costruire una distribuzione che ricorda per struttura matematica la d. normale ma è definita in \(\displaystyle \Re^+ \) ma magari è cosa già nota solo che io non la conosco.
Qualcuno ha informazioni in merito e che vuole condividere? O semplicemente gli và di intavolare un discorso su queste cose?
Un saluto a tutti e grazie!

Risposte
sinceramente non ho ben capito la domanda ma, così di primo acchito, ti dico che esistono le distribuzioni tronche e condizionate; in pratica distribuzioni con il dominio ristretto secondo particolari esigenze dell'operatore o del modello.
Per quanto riguarda la gaussiana non è affatto detto che il suo dominio empirico sia tutto $RR$, basta infatti modulare media e varianza.... se la media è 100 e la varianza 1 il dominio andrà da poco meno di 97 a poco più di 103....quindi il problema della sensatezza della grandezza fisica mi pare poco significativo. Oltretutto una distribuzione (ipotizzata) non è imposta, ma viene scelta proprio perché descrive quel determinato tipo di fenomeno.
ES: supponi di dover misurare la larghezza della scrivania e supponi di poter utilizzare qualunque tipo di strumento di misura, dal palmo della mano fino ad uno strumento che misuri anche le variazioni dovute al cambiamento di temperatura ed umidità dell'ambiente....
Ciò di cui siamo sicuri è che la larghezza "VERA" non la conosceremo mai....perché comunque noi ci adoperiamo per avere una misura corretta avremo sempre delle variazioni....varia appunto la temperatura, varia l'operatore, il profilo della scrivania magari non è esattamente perpendicolare al piano, non riesci a mettere il metro in posizione parallela al profilo del piano ecc ecc
Ma è altrettanto vero che possiamo ipotizzare che:
1) Qualunque strumento utilizziamo (anche ad occhio) gli errori per eccesso siano equiprobabili ai medesimi errori per difetto
2) Errori piccoli siano più probabili di errori grandi ( se la scrivania ha misura vera pari ad 1 metro, la probabilità che io dica che è larga 2 metri tende a zero, anche non uso alcun strumento di misura mentre la probabilità che io dica 99 cm è decisamente più alta e coincide con la probabilità che io dica 101)
Con queste premesse è naturale scegliere come distribuzione una denistà di probabilità simmetrica ed unimodale $rarr$ gaussiana per via del TLC
Ora, che la gaussiana in questione abbia dominio in $RR^+$ vien da sé considerando media e varianza del modello in questione....
ciao
Per quanto riguarda la gaussiana non è affatto detto che il suo dominio empirico sia tutto $RR$, basta infatti modulare media e varianza.... se la media è 100 e la varianza 1 il dominio andrà da poco meno di 97 a poco più di 103....quindi il problema della sensatezza della grandezza fisica mi pare poco significativo. Oltretutto una distribuzione (ipotizzata) non è imposta, ma viene scelta proprio perché descrive quel determinato tipo di fenomeno.
ES: supponi di dover misurare la larghezza della scrivania e supponi di poter utilizzare qualunque tipo di strumento di misura, dal palmo della mano fino ad uno strumento che misuri anche le variazioni dovute al cambiamento di temperatura ed umidità dell'ambiente....
Ciò di cui siamo sicuri è che la larghezza "VERA" non la conosceremo mai....perché comunque noi ci adoperiamo per avere una misura corretta avremo sempre delle variazioni....varia appunto la temperatura, varia l'operatore, il profilo della scrivania magari non è esattamente perpendicolare al piano, non riesci a mettere il metro in posizione parallela al profilo del piano ecc ecc
Ma è altrettanto vero che possiamo ipotizzare che:
1) Qualunque strumento utilizziamo (anche ad occhio) gli errori per eccesso siano equiprobabili ai medesimi errori per difetto
2) Errori piccoli siano più probabili di errori grandi ( se la scrivania ha misura vera pari ad 1 metro, la probabilità che io dica che è larga 2 metri tende a zero, anche non uso alcun strumento di misura mentre la probabilità che io dica 99 cm è decisamente più alta e coincide con la probabilità che io dica 101)
Con queste premesse è naturale scegliere come distribuzione una denistà di probabilità simmetrica ed unimodale $rarr$ gaussiana per via del TLC
Ora, che la gaussiana in questione abbia dominio in $RR^+$ vien da sé considerando media e varianza del modello in questione....
ciao
Ciao tommik e grazie per la risposta, concordo in pieno con le osservazioni e gli esempi che hai portato, tuttavia empiricamente ci si può trovare in casi in cui la posizione del valore medio non è abbastanza distante dallo zero affinché che la varianza, se mi passi il termine, "intrinseca" del fenomeno possa portare a valori non così bassi da rendere legittimo troncare il dominio empirico. Penso ad esempio ai tempi di apertura di un rubinetto nei vari usi di casa, in questo caso non solo siamo certi che non esiste un tempo vero ma penso anche che non ha nemmeno senso cercarlo.
Detto ciò tu mi dici che andrà scelta una distribuzione diversa da quella normale o che si può troncare e anche qui ovviamente concordo, ma qui vorrei chiarire un punto della mia richiesta ovvero: mi chiedo se può aver senso modificare una distribuzione, come la normale, per portarla ad una forma più consona alla distribuzione empirica?
Lo chiedo perché, da reminiscenze dei corsi di laboratorio in cui si dovevano fittare dati di segnali vari, si dava "libertà" di esplorare le funzioni che meglio approssimavano, che so, un picco di uno spettro o qualche altro segale, magari più esotico. E qui vengo ad un secondo punto: data la rilevanza della distribuzione normale in statistica si è mai provato ad "adattarla" per motivi come quelli qui descritti?
Come dire: un righello è molto utile per disegnare linee dritte su un piano, ma non è comodo per tracciare, che so, linee su un cilindro, tuttavia se lo si potesse arrotolare si avrebbe un righello per anche cilindri.
Spero di aver chiarito meglio.
Detto ciò tu mi dici che andrà scelta una distribuzione diversa da quella normale o che si può troncare e anche qui ovviamente concordo, ma qui vorrei chiarire un punto della mia richiesta ovvero: mi chiedo se può aver senso modificare una distribuzione, come la normale, per portarla ad una forma più consona alla distribuzione empirica?
Lo chiedo perché, da reminiscenze dei corsi di laboratorio in cui si dovevano fittare dati di segnali vari, si dava "libertà" di esplorare le funzioni che meglio approssimavano, che so, un picco di uno spettro o qualche altro segale, magari più esotico. E qui vengo ad un secondo punto: data la rilevanza della distribuzione normale in statistica si è mai provato ad "adattarla" per motivi come quelli qui descritti?
Come dire: un righello è molto utile per disegnare linee dritte su un piano, ma non è comodo per tracciare, che so, linee su un cilindro, tuttavia se lo si potesse arrotolare si avrebbe un righello per anche cilindri.
Spero di aver chiarito meglio.
Ciao a tutti, per dovere di cronaca vorrei riportare la distribuzione che ho provato ad impostare partendo dalla gaussiana. Ho "ampliato" li confinamento in una porzione di \(\displaystyle \Re \) (non solo quindi in \(\displaystyle \Re^+\)) di modo che si possa adattare meglio la forma della distribuzione ad un set di dati empirici. Di base si tratta di sostituire la variabile indipendente di una gaussiana con un logaritmo. Al primo tentativo avevo usato solo due parametri per la funzione: b e A. Dove b risulta essere la moda mentre A determina l'ampiezza della campana. Ad ogni modo ecco la distribuzione iniziale:
\(\displaystyle D(x, b, A)= \frac{ |A|}{b \sqrt{2 \pi e^{A^{-2}}}} e^{-\frac{A^2}{2}{(ln(x/b))^2}}\)
dove b è la moda ed il valore di aspettazione \(\displaystyle \mu \) vale:
\(\displaystyle \mu =b \frac{ |A|}{A }{ e^{\frac{3}{2A^2}}}\)
si può parametrizzare il limite inferiore (con un parametro l) quindi la distribuzione risulta definita in \(\displaystyle (l, \infty) \)
\(\displaystyle D(x, b, A,l)= \frac{ |A|}{(b-l) \sqrt{2 \pi e^{A^{-2}}}} e^{-\frac{A^2}{2}{(ln((x-l)/(b-l)))^2}}\)
Dati b e l ed una gasussiana \(\displaystyle G(x, b, \sigma) \) quest'ultima viene bene approssimata (scelto bene l) variando A in modo che:
\(\displaystyle \frac{|A|}{\sqrt{e^{A^{-2}}}} =\frac{b-l}{\sigma} \)
e si può assumere l'approssimazione
\(\displaystyle |A| \approx \frac{b-l}{\sigma} ~~ per ~~ \frac{b-l}{\sigma}>>1\)
Più è ampio b-l più la D(x, b, A, l) approssima bene una gaussiana (scelto A come detto sopra).
\(\displaystyle D(x, b, A)= \frac{ |A|}{b \sqrt{2 \pi e^{A^{-2}}}} e^{-\frac{A^2}{2}{(ln(x/b))^2}}\)
dove b è la moda ed il valore di aspettazione \(\displaystyle \mu \) vale:
\(\displaystyle \mu =b \frac{ |A|}{A }{ e^{\frac{3}{2A^2}}}\)
si può parametrizzare il limite inferiore (con un parametro l) quindi la distribuzione risulta definita in \(\displaystyle (l, \infty) \)
\(\displaystyle D(x, b, A,l)= \frac{ |A|}{(b-l) \sqrt{2 \pi e^{A^{-2}}}} e^{-\frac{A^2}{2}{(ln((x-l)/(b-l)))^2}}\)
Dati b e l ed una gasussiana \(\displaystyle G(x, b, \sigma) \) quest'ultima viene bene approssimata (scelto bene l) variando A in modo che:
\(\displaystyle \frac{|A|}{\sqrt{e^{A^{-2}}}} =\frac{b-l}{\sigma} \)
e si può assumere l'approssimazione
\(\displaystyle |A| \approx \frac{b-l}{\sigma} ~~ per ~~ \frac{b-l}{\sigma}>>1\)
Più è ampio b-l più la D(x, b, A, l) approssima bene una gaussiana (scelto A come detto sopra).
Mi chiedevo se questa distribuzione può scaturire da una cosa tipo TLC rendendo meno stringente o modificando l'assunzione del TLC che prevede la somma si variabili aleatorie con valori di aspettazione e varianze paragonabili. Qualcuno avrebbe voglia di ragionarci su? Così a senso magari con valori di aspettazione simili ma varianze che variano in un range più ampio la cosa funziona.