Fit Lineare con incertezza variabile nei valori di y
Ciao a tutti, matematici e non..
Il post che sto pubblicando, sembra effettivamente nato da una mia possibile "scarsa voglia" di impegnarmi su questo argomento.
La risposta vera è "ni".
In realtà non è la mancanza di voglia; forse più una mancanza di tempo, unita alle mie scarse basi di statistica, che mi porta ad aprire questo thread.
Veniamo al punto.
Ho una terna di valori legati da una legge lineare.
Il mio scopo è costruire una retta di regressione, dati questi valori.
Badate bene però, il punto è questo. In rete o nei libri, si trovano facilmente le formule per ricavare i valori di $A$ e $B$ (coefficiente angolare e incertezza) considerando un'incertezza nulla per i valori di $x$, e un'incertezza costante per i valori di $y$.
Il mio problema è questo, le terne di valori che ho a disposizione corrispondono a:
Il post che sto pubblicando, sembra effettivamente nato da una mia possibile "scarsa voglia" di impegnarmi su questo argomento.
La risposta vera è "ni".
In realtà non è la mancanza di voglia; forse più una mancanza di tempo, unita alle mie scarse basi di statistica, che mi porta ad aprire questo thread.
Veniamo al punto.
Ho una terna di valori legati da una legge lineare.
Il mio scopo è costruire una retta di regressione, dati questi valori.
Badate bene però, il punto è questo. In rete o nei libri, si trovano facilmente le formule per ricavare i valori di $A$ e $B$ (coefficiente angolare e incertezza) considerando un'incertezza nulla per i valori di $x$, e un'incertezza costante per i valori di $y$.
Il mio problema è questo, le terne di valori che ho a disposizione corrispondono a:
- [*:3mdevjr8]valore di $x$[/*:m:3mdevjr8]
[*:3mdevjr8]valore di $y$[/*:m:3mdevjr8]
[*:3mdevjr8]valore dell'incertezza PERCENTILE di $y$[/*:m:3mdevjr8][/list:u:3mdevjr8]
dati questi valori, quali sono le formule per costruire la retta di fit?
Vi anticipo che non mi servono assolutamente giustificazioni per le formule che mi date. Mi servirebbero solo le formule, nude e crude!
Naturalmente, dato la mia scarsissima conoscenza in materia, vi chiedo cortesemente di essere il più elementari possibili. Quello che per voi potrebbe risultare banale, per me è sicuramente un mare in cui affogarmici

Ciao a tutti e grazie in ancipo!
Risposte
se vuoi solo le formule allora è questa:
$(X^T X)^{-1}X^T y = \beta$
dpve X è una matrice in cui alla prima colonna ha tutti 1 e nelle altre i tuoi valori x, se nel tuo caso hai una sola x allora sara di due colonne e n riga, dove n è il numero delle osservazioni
Supponendo che hai solo una x, troverai un vettore $\beta$ di due componenti, che sono rispettivamente l'ìintercetta ($\beta_0$) e il beta di x (\beta_1), cioè $y= \beta_0+ \beta_1 x$
$(X^T X)^{-1}X^T y = \beta$
dpve X è una matrice in cui alla prima colonna ha tutti 1 e nelle altre i tuoi valori x, se nel tuo caso hai una sola x allora sara di due colonne e n riga, dove n è il numero delle osservazioni
Supponendo che hai solo una x, troverai un vettore $\beta$ di due componenti, che sono rispettivamente l'ìintercetta ($\beta_0$) e il beta di x (\beta_1), cioè $y= \beta_0+ \beta_1 x$
Grazie mille per l'interessamento.
Non so se sbaglio ma, con quella formula non tengo conto dell'errore percentile sulle y...
Cioè il dy non è sempre proporzionale alle misure..
è un caso un po' strano, sicuramente non rispecchia tanto la realtà.
Non so se sbaglio ma, con quella formula non tengo conto dell'errore percentile sulle y...
Cioè il dy non è sempre proporzionale alle misure..
è un caso un po' strano, sicuramente non rispecchia tanto la realtà.
Guarda, quello che chiami errore percentile io penso che siano semplicemente i percentili della distribuzione di y, se è come dico io significa che tu vuoi trovare quest modello $y= \beta_0+\beta_1x + \epsilon$ dove $\epsilon \sim N(0, \sigma^2)$.
Con un modello del genere significa che $y \sim N(\beta_0+\beta_1x, \sigma^2)$. I tuoi percentili sono semplicemente i percentili della distribuzione di y. L'incertezza sulla y è modellizzata nel modello dalla $\epsilon$.
COn questo modello sono valide le formule che ti ho messo prima
Con un modello del genere significa che $y \sim N(\beta_0+\beta_1x, \sigma^2)$. I tuoi percentili sono semplicemente i percentili della distribuzione di y. L'incertezza sulla y è modellizzata nel modello dalla $\epsilon$.
COn questo modello sono valide le formule che ti ho messo prima
Mi viene un altro dubbio...forse con incertezza percentile intendi che le varie y hanno tutte delle varianze diverse?....
Perchè non metti i dati così che mi fai capire meglio
Perchè non metti i dati così che mi fai capire meglio
Allora, in parole povere il discorso è questo.
ho una misura di x, una misura di y e un'incertezza variabile sulle misure di ogni y. Le incertezze sono espresse in percentile.
Ad esempio se ho due misure identiche nelle y (ipoteticamente) non è detto che anche le loro incertezze siamo "identiche" tra loro.
Perdona il linguaggio scorretto e poco settoriale, ma sono molto poco preparato in materia..
ho una misura di x, una misura di y e un'incertezza variabile sulle misure di ogni y. Le incertezze sono espresse in percentile.
Ad esempio se ho due misure identiche nelle y (ipoteticamente) non è detto che anche le loro incertezze siamo "identiche" tra loro.
Perdona il linguaggio scorretto e poco settoriale, ma sono molto poco preparato in materia..
Allora se tu per ogni y hai un solo valore allora probabilmente quello è il valore della sua varianza (percentile non significa niente!))...in questo caso allora devi usare la formula dei minimi quadrati generalizzati che è:
$(X^T \Sigma^{-1}X)^{−1}X^T\Sigma^{-1}y=\beta$
dove $\Sigma^{-1}$ è una matrice diagonale al cui posto $(j,j)$ ha il valore della varianza (incertezza) di $y_j$
$(X^T \Sigma^{-1}X)^{−1}X^T\Sigma^{-1}y=\beta$
dove $\Sigma^{-1}$ è una matrice diagonale al cui posto $(j,j)$ ha il valore della varianza (incertezza) di $y_j$
Per correttezza \(\displaystyle \Sigma \) è la matrice che ha sulla diagonale le varianze delle \(\displaystyle y \) e poi va invertita e utilizzata come espresso sopra.
avevo fatto copia e incolla dalla formula e non avevo notato il -1

Grande!
Grazie mille per la disponibilità!!
Ciao!
Grazie mille per la disponibilità!!
Ciao!