Curva probabilistica con limiti superiore e inferiore?
Ciao a tutti,
mi trovo ad analizzare dati di temperatura; ho a disposizione 6 campioni annuali (2005-2010) con risoluzione di un dato ogni 24 h.
Ho calcolato, per ciascun giorno, media e varianza. Quello che voglio ottenere è la creazione di un ciclo di temperatura annuale sintetico sulla base dei dati a disposizione, in questo modo:
a) creo la curva di probabilità cumulata per ciascun giorno a partire da media e varianza;
b) scelgo un numero random 0:1 (probabilità);
c)per ciascun giorno, entro nella cumulata con il valore di probabilità e ricavo il valore di temperatura.
Fino a qui tutto ok, il problema è che ho pochi anni a disposizione (6) e la varianza è elevata (c'è un anno particolarmente caldo rispetto agli altri). Di conseguenza ho grande probabilità di trovare valori molto lontani dalla media e dalla realtà.
Mi chiedevo se esistesse un modo per costruire una curva di probabilità (ovviamente non più normale) tale per cui i valori di temperatura abbiamo una probabilità p (diciamo p=99%) di accadere tra il massimo e il minimo di Temperatura misurata.
Grazie e buona giornata
mi trovo ad analizzare dati di temperatura; ho a disposizione 6 campioni annuali (2005-2010) con risoluzione di un dato ogni 24 h.
Ho calcolato, per ciascun giorno, media e varianza. Quello che voglio ottenere è la creazione di un ciclo di temperatura annuale sintetico sulla base dei dati a disposizione, in questo modo:
a) creo la curva di probabilità cumulata per ciascun giorno a partire da media e varianza;
b) scelgo un numero random 0:1 (probabilità);
c)per ciascun giorno, entro nella cumulata con il valore di probabilità e ricavo il valore di temperatura.
Fino a qui tutto ok, il problema è che ho pochi anni a disposizione (6) e la varianza è elevata (c'è un anno particolarmente caldo rispetto agli altri). Di conseguenza ho grande probabilità di trovare valori molto lontani dalla media e dalla realtà.
Mi chiedevo se esistesse un modo per costruire una curva di probabilità (ovviamente non più normale) tale per cui i valori di temperatura abbiamo una probabilità p (diciamo p=99%) di accadere tra il massimo e il minimo di Temperatura misurata.
Grazie e buona giornata
Risposte
Ovviamente se non si può ditemelo, così cerco una soluzione alternativa; o se avete qualche soluzione alternativa da consigliarmi fate pure!
Ciao
Ciao
Ciao, in effetti 6 osservazioni mi sembrano troppo esigue anche per fare un test di normalità.
Ti propongo un modo per aumentare le osservazioni: potresti "orlare" il giorno corrente con un certo numero di giorni precedenti e successivi. Ad esempio oggi è 8 Aprile e hai 6 osservazioni dal 2005 al 2011. Potresi considerare la settimana (aggiungi 3 giorni prima e dopo) centrata sulla data corrente che va quindi dal 5 all'11 Aprile inclusi. In questo modo avresti 42 osservazioni. Oppure consideri 2 giorni prima/dopo in modo da avere 5 giorni complessivi centrati sulla data corrente e in totale 30 osservazioni.
La giustificazione è che le temperature non dovrebbero essere molto dissimili in pochi giorni consecutivi..
Potresti quindi ripetere il calcolo di media e varianza e verificare se le cose migliorano.
Credo che ne esistano teoricamente infinite di tali possibilità.
Il primo esempio che mi viene in mente è di considerare una distribuzione uniforme.
La distribuzione di riferimento è una uniforme sull'intervallo $[T_min,T_max]$. Naturalmente l'area sottesa dalla funzione densità di probabilità è pari ad $1$.
"Allarghiamo" ora tale distribuzione uniforme all'intervallo simmetrico $[T_min-delta,T_max+delta]$.
Occorre determinare il valore di $delta$ in modo che $P(T_min<=T<=T_max)=p<1$.
Posto $DeltaT=T_max-T_min$ si ha allora $P(T_min<=T<=T_max)=(DeltaT)/(DeltaT+2delta)=p->delta=(DeltaT(1-p))/(2p)$
Se ad esempio $p=0.90$, $T_min=10°$, $T_max=19°$, risulta $delta=0.5°$ e quindi il nuovo intervallo della distribuzione uniforme è $[9.5°,19.5°]$
Inoltre commisurerei la scelta del valore $p$ al numero dei dati a disposizione. Con soli 6 dati non credo ti possa fidare molto delle temperature massime e minime registrate, quindi sceglierei un $p$ non troppo alto. Viceversa con più dati a disposizione.
Ovviamente con questo modello uniforme basato solo sulla minima e massima temperatura perdi il controllo sulla media e sulla varianza...
Ti propongo un modo per aumentare le osservazioni: potresti "orlare" il giorno corrente con un certo numero di giorni precedenti e successivi. Ad esempio oggi è 8 Aprile e hai 6 osservazioni dal 2005 al 2011. Potresi considerare la settimana (aggiungi 3 giorni prima e dopo) centrata sulla data corrente che va quindi dal 5 all'11 Aprile inclusi. In questo modo avresti 42 osservazioni. Oppure consideri 2 giorni prima/dopo in modo da avere 5 giorni complessivi centrati sulla data corrente e in totale 30 osservazioni.
La giustificazione è che le temperature non dovrebbero essere molto dissimili in pochi giorni consecutivi..
Potresti quindi ripetere il calcolo di media e varianza e verificare se le cose migliorano.
"chetto_82":
Mi chiedevo se esistesse un modo per costruire una curva di probabilità (ovviamente non più normale) tale per cui i valori di temperatura abbiamo una probabilità p (diciamo p=99%) di accadere tra il massimo e il minimo di Temperatura misurata.
Credo che ne esistano teoricamente infinite di tali possibilità.
Il primo esempio che mi viene in mente è di considerare una distribuzione uniforme.
La distribuzione di riferimento è una uniforme sull'intervallo $[T_min,T_max]$. Naturalmente l'area sottesa dalla funzione densità di probabilità è pari ad $1$.
"Allarghiamo" ora tale distribuzione uniforme all'intervallo simmetrico $[T_min-delta,T_max+delta]$.
Occorre determinare il valore di $delta$ in modo che $P(T_min<=T<=T_max)=p<1$.
Posto $DeltaT=T_max-T_min$ si ha allora $P(T_min<=T<=T_max)=(DeltaT)/(DeltaT+2delta)=p->delta=(DeltaT(1-p))/(2p)$
Se ad esempio $p=0.90$, $T_min=10°$, $T_max=19°$, risulta $delta=0.5°$ e quindi il nuovo intervallo della distribuzione uniforme è $[9.5°,19.5°]$
Inoltre commisurerei la scelta del valore $p$ al numero dei dati a disposizione. Con soli 6 dati non credo ti possa fidare molto delle temperature massime e minime registrate, quindi sceglierei un $p$ non troppo alto. Viceversa con più dati a disposizione.
Ovviamente con questo modello uniforme basato solo sulla minima e massima temperatura perdi il controllo sulla media e sulla varianza...
Ciao Cenzo e grazie per i suggerimenti.
Inizialmente operavo come suggerivi tu con una distribuzione uniforme tra Tmin e Tmax, poi ho deciso di calcolare una distribuzione di probabilità perchè mi pareva più robusta come scelta.
Proverò il primo suggerimento, calcolare media e varianza "orlando" il giorno corrente con alcuni giorni successivi e precedenti (ovviamente dovrò separare giorno da notte essendo la risoluzione dei miei dati di 12 ore)
Ciao e grazie ancora.
Ovviamente altri suggerimenti sono ben accetti. Per esempio: è possibile ricorrere in modo semplice ad una distribuzione non normale? In modo semplice perchè questa è solo la punta dell'iceberg, poi questa analisi mi servirà per costruire la condizione al contorno in un modello numerico.
Chetto[/img]
Inizialmente operavo come suggerivi tu con una distribuzione uniforme tra Tmin e Tmax, poi ho deciso di calcolare una distribuzione di probabilità perchè mi pareva più robusta come scelta.
Proverò il primo suggerimento, calcolare media e varianza "orlando" il giorno corrente con alcuni giorni successivi e precedenti (ovviamente dovrò separare giorno da notte essendo la risoluzione dei miei dati di 12 ore)
Ciao e grazie ancora.
Ovviamente altri suggerimenti sono ben accetti. Per esempio: è possibile ricorrere in modo semplice ad una distribuzione non normale? In modo semplice perchè questa è solo la punta dell'iceberg, poi questa analisi mi servirà per costruire la condizione al contorno in un modello numerico.
Chetto[/img]
Domanda:
aggiungere al giorno corrente i valori di alcuni giorni precedenti e successivi (es 2 prima e 2 dopo), equivale a calcolare media e varianza su una curva di andamenteo stagionale delle temperature dopo averla modificata applcando una media mobile (in questo caso finestra di 5 giorni centrata sul giorno corrente)?
ciao
aggiungere al giorno corrente i valori di alcuni giorni precedenti e successivi (es 2 prima e 2 dopo), equivale a calcolare media e varianza su una curva di andamenteo stagionale delle temperature dopo averla modificata applcando una media mobile (in questo caso finestra di 5 giorni centrata sul giorno corrente)?
ciao
"chetto_82":
Inizialmente operavo come suggerivi tu con una distribuzione uniforme tra Tmin e Tmax, poi ho deciso di calcolare una distribuzione di probabilità perchè mi pareva più robusta come scelta.
è possibile ricorrere in modo semplice ad una distribuzione non normale?
In ogni caso, penso che l'ipotesi sulla distribuzione, qualunque essa sia, andrebbe verificata con un opportuno test statistico.
Scusa Cenzo se ne approfitto: che test mi consigli? test X per esempio?
E cosa ne pensi della domanda del mio intervento precedente?
grazie
chetto
E cosa ne pensi della domanda del mio intervento precedente?
grazie
chetto
Torno a crivere, ho vagliato tutte le possibilità ma forse la strada da percorrere è differente: forse è più opportuna una curva di distribuzione assimmetrica (Gumbel?Rayleigh?Weibull? ...)
Cosa ne dite? Quale è quella consigliabile?
Mha
Cosa ne dite? Quale è quella consigliabile?
Mha
O forse meglio ancora log-normale o gamma?