Retta di regressione lineare

_overflow_1
Salve a tutti!!!

Stavo svolgendo questo esercizio:

Si determini l’equazione della retta di regressione lineare relativa ai seguenti
punti del piano cartesiano:
$A(−1,−1), B(0, 3), C(2, 0)$.

Per questo punto non ho avuto problemi e credo che il procedimento sia giusto.
In pratica mi sono calcolato $A^TA$ poi $A^Tb$ dove:
$A = ((-1, 1), (0, 1), (2, 1))$ e $b = ((-1), (0), (3))$
ed infine mi sono risolto il sistema $A^TAx = A^Tb$
trovando come risultato $p_1(x) = 1/14x + 9/14$

ora però c'è un altro punto da risolvere che dice:
Con riferimento al punto precedente si supponga di scegliere $B(x, 3)$, dove
x `e un parametro reale. Si determini per quale valore di $x in [−1, 3]$ lo
scarto quadratico medio (nell’approssimazione dei dati mediante la retta
di regressione lineare) risulta minimo.

In pratica devo procedere come nel primo punto? e risolvere il sistema e considerare x come un parametro?

Risposte
Raptorista1
Sì, devi vedere se c'è una \(x\) per cui l'approssimazione è migliore delle altre.
In questo caso, la soluzione è banale e pure evidente ad occhio senza bisogno di troppi calcoli!

Linux1987
Sono curioso di sapere se lo svolgimento sia questo: si impone l'elemento $A_(2,1)=x$ dopo diche si calcola $A^T*A $ e $y=A^T*y$, e si pone $ det(A^T*A )!=0 $ e si determina il valore di $ x$?

Raptorista1
Non ho ben capito cosa proponi; comunque la soluzione evidente è di spostare il terzo punto in modo che sia allineato coi primi due.
In questo caso l'interpolazione diventa esatta e l'errore nullo.

Linux1987
io intendevo ripetere il procedimento per la determinazione del sistema delle equazioni normali , e quindi della sua matrice dei coefficienti definita da $A^T*A$ , dove $A=$ $ {: ( -1 , 1 ),( x , 1 ),( 2 , 1 ) :} $ e quindi $A^T*A = ( ( x^2+5 , x+1 ),( x+1 , 3 ) ) $ e porre $ det(A^T*A)!=0 $ per valutare poi $ x,$ il problema è che mi viene un'equazione di secondo grado $ 2*x^2-2*x+14 $ e non so come procedere, di sicuro il determinante è diverso da 0 , perchè se pongo quest'equazione uguale a zero non ha soluzioni reali

Raptorista1
No, non è quella la soluzione!
Devi fare in modo che il punto \((x,3)\) appartenga alla retta che passa per \(A\) e \(C\): è un problema da terza liceo!

Sul resto, non ho pensato al tuo ragionamento perché ora sto facendo altro [di molto più noioso...] e quindi non mi ci metto nemmeno.
Comunque, se poi trovi di nuovo la soluzione giusta allora è probabile che il ragionamento sia corretto.

Linux1987
non ho mai fatto il liceo !! sono un autodidatta!

PS alla retta per $A $ e per $C$

Linux1987
"_overflow_":
Salve a tutti!!!

Stavo svolgendo questo esercizio:

Si determini l’equazione della retta di regressione lineare relativa ai seguenti
punti del piano cartesiano:
$A(−1,−1), B(0, 3), C(2, 0)$.

Per questo punto non ho avuto problemi e credo che il procedimento sia giusto.
In pratica mi sono calcolato $A^TA$ poi $A^Tb$ dove:
$A = ((-1, 1), (0, 1), (2, 1))$ e $b = ((-1), (0), (3))$
ed infine mi sono risolto il sistema $A^TAx = A^Tb$

Il vettore dei termini noti è scritto male!! dovrebbe essere $b= ( ( -1 ),( 3 ),( 0 ) ) $

@Raptorista: ho usato l'equazione della retta per due punti , o meglio quella che passa per i punti $A(-1,-1) $ e $C(2,0)$ e l'ho posta uguale a 3. Ovvero $ (y-(-1))/(0-(-1))=(x-(-1))/(2-(-1)) $ da cui $(1/3)*x-2/3$ posta uguale a 3: $(1/3)*x-2/3=3$ , viene 11, cosa sbaglio?

Raptorista1
"pasqualinux":
non ho mai fatto il liceo !! sono un autodidatta!

Non so se mi stai prendendo in giro o è una battuta :D

"pasqualinux":

PS alla retta per $A $ e per $C$

Whatever! XD

Linux1987
nessuna delle due!! è vero!! ho fatto una pessima scuola professionale dove non si faceva nulla di matematica e ora mi sto appassionando!! quindi pietà!! anzi non sai che darei per tornare indietro!

ps errore trovato!!
però mi viene x=11!!
mentre $ x in [-1,3]$ secondo l'esercizio!!

Raptorista1
Ah già, mi ero perso la condizione sulla \(x\) XD
\(x = 11\) mi suona giusta, ma è incompatibile con la soluzione, quindi bisogna trovarne una che sia in quell'intervallo.
No problem, comunque: ecco una dritta [che non so se sia giusta, ma ad occhio sembra].
La retta di regressione cambia in funzione di \(x\); l'errore cambia in funzione della retta di regressione.
Questo significa che posso costruire la funzione che associa ad una generica \(x\) l'errore commesso scegliendo quella \(x\).

Se hai capito questo, il resto è solo un problema di minimo sull'errore in funzione della \(x\).

Linux1987
non mi è molto chiaro !!
In parole povere dovrei determinare per quale $ x in [-1,3 ] $ la retta passante per i punti $ A(-1,1) $ e $C(2,0)$ ha distanza minima dal punto $ B(x,3) $.

Linux1987
ho trovato il valore è 3, ma lo ho ottenuto in matlab calcolando l'ascissa in cui la funzione "distanza di un punto da una retta" , assume punto minimo, ma se non avessi avuto matlab come avrei fatto??

ps ho utilizzato $ d= (y_0 - m*x_0 - q)/ (1 + m^2) $ dove $y0=3$ ovvero l'ordinata di B e x_0=x, quindi l'ho resa una funzione nella variabile x e ho calcolato il minimo !! http://www.ripmat.it/mate/d/dc/dceh.html

Raptorista1
Penso che non vada bene perché nel calcolo dell'errore della regressione lineare non si considera la "distanza punto-retta" ma la distanza verticale, cioè \(y_p - y_r\).

Linux1987
si ma io ho reso la distanza del punto funzione di x , y e fissato ,di conseguenza vado a determinare per quale valore di x , y ha distanza minima dalla retta, he passa per i punti sopra citati ,dovrebbe garantire l'errore minimo, perchè gia che la retta passi per i due punti significa che l'errore è solo nella seconda ordinata !!
ps altrimenti quale sarebbe la soluzione??

_overflow_1
Salve!!!

Scusate se rispondo così in ritardo... grazie mille a tutti per i preziosi consigli...

Linux1987
hai avuto la soluzione del problema?? io non ho capito ancora come risolverlo!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.