Numero di gradi di libertà (Media)

giuscri
Buongiorno,

sto studiando un testo basic di Statistica quando mi sono imbattutto in un concetto che ho sentito ripetere tante volte ma non ho mai metabolizzato. Riporto la citazione dal libro:


Si definisca la deviazione standard definita come

    $\sigma_x = (sum_(i = 1)^N (x_i - \barx) ^ 2) / (N-1)$[/list:u:3rvkmv9i]

    Prima di poterla calcolare abbiamo bisogno del nostro set di dati ${x_1, ..., x_N}$ per estrarre la media $\barx$. In un certo senso, questo lascia soltanto $N-1$ valori misurati indipendenti così diciamo che avendo calcolato $\barx$ abbiamo soltanto $N - 1$ gradi di libertà.

    In generale definiamo il numero di gradi di libertà nell'ambito di un calcolo statistico come il numero di misure indipendenti meno il numero di parametri calcolati da queste misure.


Faccio fatica a capire davvero il senso di questa affermazione. Però un'idea me la sono fatta: vi chiedo se vi sembra corretta.

La media $\barx$ si calcola come

    $\barx = (x_1 + ... + x_N) / N$[/list:u:3rvkmv9i]

    i.e. posso scrivere

      $N \barx - (x_2 + ... + x_N) = x_1$*[/list:u:3rvkmv9i]

      In un certo senso finché non calcolo la media, tutti ed $N$ possono ballare lungo $RR$ (perché la media non è stata ancora determinata). L'esistenza (passatemi il termine) di quella media ne blocca almeno uno. Gli altri dovranno mantenersi coordinati per rispettare l'identità *, ma presa singolarmente ciascuna $x_i$ può avere un valore qualsiasi.

      Mi scuso per questa esposizione un po' romanzata :lol: ; ma in termini formali questa storia la trovo già scritta sul mio libro e non sono sicuro di capire.

      Grazie per l'attenzione!

Risposte
giuscri
Up!

giuscri
"Sergio":
Onestamente preferirei un "romanzo" un po' diverso.
In fondo, quei valori possono ballare lungo \(\mathbb{R}\) sia prima che dopo il calcolo della media.
Il vero problema è un altro e sorge quando ti proponi di misurare la dispersione dei valori intorno alla loro media.
Quelli che non possono "ballare" sono gli \(n\) scarti dalla media, perché la loro somma è zero. In questo senso ci sono \(n-1\) gradi di libertà: una volta calcolati \(n-1\) scarti, l'\(n\)-esimo è dato, non può che essere quello che è (un valore tale che rende nulla la somma degli scarti).


La compro! :) Grazie, Sergio.

Giuseppe

login2
Sergio e Giuseppe, scusate se riapro la questione di questo topic ma ho lo stesso identico dubbio di Giuseppe su n-1 e lo scarto quadratico medio, tuttavia vorrei chiedere qualche chiarimento lo stesso, è che io ho appena iniziato con statistica applicata alla fisica e non capisco perchè si deve mettere per forza n-1, insomma ok la somma degli scarti è per definizione 0 ma questo perchè mi impedisce di metterlo al denominatore dello scarto quadratico medio? :s

login2
mmmm...quindi il Numero di gradi di liberta' dipende dalle dimensioni del sistema, pero se io volessi dare una spiegazione do n-1 che non coinvolga le dimensioni e I gradi di liberta'? insomma se volessi spiegare a un bambino perche' si mette n-1 senza usare I gradi di liberta' o le dimensioni? In relazione poi solo alla distribuzione di dati in un istogramma senza pensare ad altre varianze?

Ariz93
Serg io o scusa se riprendo il post ma visto che login non risponde + m'inserisco io ,(se vuoi ho aperto un thread su pensare un po di+ con un discorso un po piu ampio....in quanto alla variabilità quindi più aumenta la dimensione (cioè più aumentano i parametri e più i gradi di libertà diminuiscono??

Ps:carino il discorso dei punti...melo rivendo!!! :lol:

giuscri
"Ariz93":
..in quanto alla variabilità quindi più aumenta la dimensione (cioè più aumentano i parametri e più i gradi di libertà diminuiscono??


Prova a spiegarti meglio :wink:

Ariz93
"giuscri":
[quote="Ariz93"]..in quanto alla variabilità quindi più aumenta la dimensione (cioè più aumentano i parametri e più i gradi di libertà diminuiscono??


Prova a spiegarti meglio :wink:[/quote]
Pensa all'esempio che ha fatto sergio.. se io ho dei punti sull'asse x essi hanno una coordinata in una dimensione,, ora pensa di aumentare le dimensioni fino a n ci saranno n coordinate per individuare questi punti,più dimensioni hai e più equazioni parametriche possiedi, ad ogni equazione parametrica aggiunta togli la l'arbitrarietà di assegnare ad un punto un qualsiasi valore...cioè se hai due punti legati da un parametro dato un valore ad uno l'altro è determinato.
Ora pensa alla media,dati $x_1.....x_n $ valori la media è automaticamente definita e quindi togli un grado do libertà cioè quello di poter scegliere il valore della media.

giuscri
"Ariz93":
[quote="giuscri"][quote="Ariz93"]..in quanto alla variabilità quindi più aumenta la dimensione (cioè più aumentano i parametri e più i gradi di libertà diminuiscono??


Prova a spiegarti meglio :wink:[/quote]
Pensa all'esempio che ha fatto sergio.. se io ho dei punti sull'asse x essi hanno una coordinata in una dimensione,, ora pensa di aumentare le dimensioni fino a n ci saranno n coordinate per individuare questi punti,più dimensioni hai e più equazioni parametriche possiedi, ad ogni equazione parametrica aggiunta togli la l'arbitrarietà di assegnare ad un punto un qualsiasi valore...cioè se hai due punti legati da un parametro dato un valore ad uno l'altro è determinato.
Ora pensa alla media,dati $x_1.....x_n $ valori la media è automaticamente definita e quindi togli un grado do libertà cioè quello di poter scegliere il valore della media.[/quote]

Devo ammettere che quello che dice Sergio usando l'immagine dei punti non mi è chiarissimo.

Provo a fornire un altro esempio -l'ultimo, eh ...poi dovremmo cominciare a studiare e basta :wink: . Se la variabilità, nell'esempio dei punti, è la distanza dall'origine, in 1-dim la variabilità è massima perchè ad ogni distanza corrisponde un punto. Questo non è già più vero in 2-dim dove hai "molti" più punti che condividono la stessa distanza dall'origine (circonferenza ...), quindi a diversi punti non corrispondono diverse distanze dall'origine. E così via ... Quello che dici sulle equazioni parametriche sinceramente non lo capisco.

Ma i gradi di libertà aumentano, invece, all'aumentare delle dimensioni: i punti possono muoversi con più liberta in uno spazio 3-dim che in uno monodimensionale.

Ariz93
il discorso sulle equazioni parametriche era per semplificare (ma hai impicciato le idee anche a me xD) .
Allora riguarda come sergio vuole calcolare lvariabilita...all'aumentare delle dimensioni la possibilità che i punti siano distribuiti sull'asse x diminuisce proprio perché come dici tu i punti potrebbero stare su una circonferenza ed avere la stessa variabilità oppure su una sfera in 3 dimensioni. Penso che il discorso sia più probabilistico cioè i casi totali aumentano all'aumentare delle dimensioni. (Ora però mi sto impicciando anch'io xD aspettiamo sergio se ci può spiegare meglio...)

Ariz93
"Sergio":
[quote="Ariz93"]in quanto alla variabilità quindi più aumenta la dimensione (cioè più aumentano i parametri e più i gradi di libertà diminuiscono??

Che intendi per parametri?
Posso dirti che se in una regressione hai tanti parametri quante sono le osservazioni non hai più gradi di libertà e la regressione non la fai.
Avresti una matrice di dati quadrata. Se questa fosse a rango pieno (come è comunque necessario), avresti una situazione del tipo \(\displaystyle \mathbf{y}=\mathbf{X}\mathbb{\beta} \), \(\displaystyle \mathbb{\beta}=\mathbf{X}^{-1}\mathbf{y} \): una soluzione esatta, matematica, senza l'incertezza che la statistisca gestisce. Non avresti più variabilità da spiegare.
Da altro punto di vista, avresti una soluzione sì "esatta", ma consistente in \(n\) parametri da interpretare in luogo di \(n\) osservazioni da interpretare: non ci avresti guadagnato nulla.[/quote]
ok ho capito un po quello che hai detto,però ancora non capisco bene ,ammettiamo che ho n misure e calcolo la media, ora voglio la deviazione standard...comunque ho sempre n valori arbitrari e 1 che è ricavato dagli altri la media...inoltre ho visto la definizione di gradi di libertà e non riesco a paragonarla al tuo esempio sulla variabilità come diceva giuscri hanno più possibilità di andare in "altri posti" ma è una questione di probabilità???

Ariz93
Aiutami ancora un po per favore...(lo so sono stupido :lol: ) si divide per i gradi di libertà per specificare che un dato punto in n dimensioni ha meno possibilità di trovarsi a quelle coordinate (fissata la distanza dal centro) rispetto ad uno stesso punto ma in una dimensione???

Ariz93
"Sergio":
Ma no! Sono solo esempi!
Se due "cose" A e B variano nello stesso modo, ma A poteva variare solo in quel modo mentre B poteva variare in tanti altri, è chiaro che la variabilità di A è maggiore (sfrutta tutta l'unica possibilità che aveva) e quella di B è minore (non ha sfruttato le altre possibilità che aveva). I gradi di libertà non sono altro che i "modi" in cui una "cosa" può variare.

Come fai a misurare la maggiore variazione di A?
Diciamo che, in termini "assoluti", la variazione di A è 27 (numero a caso senza alcun particolare significato), quella di B pure. Ma A poteva variare in un solo modo, B in tre.
Calcoli quindi la variazione di A con \(27/1=27\), quella di B con \(27/3=9\). Dato che \(9<27\), ha quantificato il fatto che B, rispetto ad A, è variato di meno.

Se pui vuoi ancora pensare a punti, in generale a oggetti geometrici, considera il teorema di Rouché-Capelli.
Se un sistema compatibile ha una matrice di rango \(n\) e \(m\) incognite, con \(m>n\), lo spazio delle soluzioni ha \(m-n\) gradi di libertà (cosa espressa un po' impropriamente dicendo che le soluzioni sono \(\infty^{m-n}\)).
Il sistema di una sola equazione \(x+2y-3z=8\) ha uno spazio delle soluzioni di dimensione \(3-1=2\): un piano (le soluzioni possono variare in due dimensioni, hanno due gradi di libertà).
Il sistema di due equazioni \(\displaystyle \begin{cases} x+2y-3z=0 \\ 3x-y+2z=1 \end{cases}\) ha uno spazio delle soluzioni di dimensione \(3-2=1\): una retta (le soluzioni possono variare in una dimensione, hanno un grado di libertà).

Perfetto!! Questa spiegazione è quella che mi serviva grazie sergio,si può dire che i gradi di libertà sono anche la dimensione del Ker della matrice associata al sistema diequazioni??(inerente all'esempio che hai proposto tu...)

Ariz93
Sergio mi hai abbandonato ....

Ariz93
Up!!

Ariz93
Capito...ora ci penso un po. Comunque grazie.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.