Curva probabilistica con limiti superiore e inferiore?

chetto_82
Ciao a tutti,

mi trovo ad analizzare dati di temperatura; ho a disposizione 6 campioni annuali (2005-2010) con risoluzione di un dato ogni 24 h.
Ho calcolato, per ciascun giorno, media e varianza. Quello che voglio ottenere è la creazione di un ciclo di temperatura annuale sintetico sulla base dei dati a disposizione, in questo modo:
a) creo la curva di probabilità cumulata per ciascun giorno a partire da media e varianza;
b) scelgo un numero random 0:1 (probabilità);
c)per ciascun giorno, entro nella cumulata con il valore di probabilità e ricavo il valore di temperatura.

Fino a qui tutto ok, il problema è che ho pochi anni a disposizione (6) e la varianza è elevata (c'è un anno particolarmente caldo rispetto agli altri). Di conseguenza ho grande probabilità di trovare valori molto lontani dalla media e dalla realtà.
Mi chiedevo se esistesse un modo per costruire una curva di probabilità (ovviamente non più normale) tale per cui i valori di temperatura abbiamo una probabilità p (diciamo p=99%) di accadere tra il massimo e il minimo di Temperatura misurata.

Grazie e buona giornata

Risposte
chetto_82
Ovviamente se non si può ditemelo, così cerco una soluzione alternativa; o se avete qualche soluzione alternativa da consigliarmi fate pure!

Ciao

cenzo1
Ciao, in effetti 6 osservazioni mi sembrano troppo esigue anche per fare un test di normalità.

Ti propongo un modo per aumentare le osservazioni: potresti "orlare" il giorno corrente con un certo numero di giorni precedenti e successivi. Ad esempio oggi è 8 Aprile e hai 6 osservazioni dal 2005 al 2011. Potresi considerare la settimana (aggiungi 3 giorni prima e dopo) centrata sulla data corrente che va quindi dal 5 all'11 Aprile inclusi. In questo modo avresti 42 osservazioni. Oppure consideri 2 giorni prima/dopo in modo da avere 5 giorni complessivi centrati sulla data corrente e in totale 30 osservazioni.
La giustificazione è che le temperature non dovrebbero essere molto dissimili in pochi giorni consecutivi..
Potresti quindi ripetere il calcolo di media e varianza e verificare se le cose migliorano.

"chetto_82":
Mi chiedevo se esistesse un modo per costruire una curva di probabilità (ovviamente non più normale) tale per cui i valori di temperatura abbiamo una probabilità p (diciamo p=99%) di accadere tra il massimo e il minimo di Temperatura misurata.

Credo che ne esistano teoricamente infinite di tali possibilità.
Il primo esempio che mi viene in mente è di considerare una distribuzione uniforme.
La distribuzione di riferimento è una uniforme sull'intervallo $[T_min,T_max]$. Naturalmente l'area sottesa dalla funzione densità di probabilità è pari ad $1$.

"Allarghiamo" ora tale distribuzione uniforme all'intervallo simmetrico $[T_min-delta,T_max+delta]$.
Occorre determinare il valore di $delta$ in modo che $P(T_min<=T<=T_max)=p<1$.
Posto $DeltaT=T_max-T_min$ si ha allora $P(T_min<=T<=T_max)=(DeltaT)/(DeltaT+2delta)=p->delta=(DeltaT(1-p))/(2p)$

Se ad esempio $p=0.90$, $T_min=10°$, $T_max=19°$, risulta $delta=0.5°$ e quindi il nuovo intervallo della distribuzione uniforme è $[9.5°,19.5°]$

Inoltre commisurerei la scelta del valore $p$ al numero dei dati a disposizione. Con soli 6 dati non credo ti possa fidare molto delle temperature massime e minime registrate, quindi sceglierei un $p$ non troppo alto. Viceversa con più dati a disposizione.

Ovviamente con questo modello uniforme basato solo sulla minima e massima temperatura perdi il controllo sulla media e sulla varianza...

chetto_82
Ciao Cenzo e grazie per i suggerimenti.
Inizialmente operavo come suggerivi tu con una distribuzione uniforme tra Tmin e Tmax, poi ho deciso di calcolare una distribuzione di probabilità perchè mi pareva più robusta come scelta.

Proverò il primo suggerimento, calcolare media e varianza "orlando" il giorno corrente con alcuni giorni successivi e precedenti (ovviamente dovrò separare giorno da notte essendo la risoluzione dei miei dati di 12 ore)

Ciao e grazie ancora.

Ovviamente altri suggerimenti sono ben accetti. Per esempio: è possibile ricorrere in modo semplice ad una distribuzione non normale? In modo semplice perchè questa è solo la punta dell'iceberg, poi questa analisi mi servirà per costruire la condizione al contorno in un modello numerico.

Chetto[/img]

chetto_82
Domanda:

aggiungere al giorno corrente i valori di alcuni giorni precedenti e successivi (es 2 prima e 2 dopo), equivale a calcolare media e varianza su una curva di andamenteo stagionale delle temperature dopo averla modificata applcando una media mobile (in questo caso finestra di 5 giorni centrata sul giorno corrente)?
ciao

cenzo1
"chetto_82":
Inizialmente operavo come suggerivi tu con una distribuzione uniforme tra Tmin e Tmax, poi ho deciso di calcolare una distribuzione di probabilità perchè mi pareva più robusta come scelta.

è possibile ricorrere in modo semplice ad una distribuzione non normale?

In ogni caso, penso che l'ipotesi sulla distribuzione, qualunque essa sia, andrebbe verificata con un opportuno test statistico.

chetto_82
Scusa Cenzo se ne approfitto: che test mi consigli? test X per esempio?
E cosa ne pensi della domanda del mio intervento precedente?

grazie
chetto

chetto_82
Torno a crivere, ho vagliato tutte le possibilità ma forse la strada da percorrere è differente: forse è più opportuna una curva di distribuzione assimmetrica (Gumbel?Rayleigh?Weibull? ...)
Cosa ne dite? Quale è quella consigliabile?
Mha

chetto_82
O forse meglio ancora log-normale o gamma?

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.