Derivate di matrici
Salve a tutti; in questo periodo ho a che fare con econometria e il materiale su cui studio dà per scontato una conoscenza abbastanza profonda di algebra lineare (come è giusto che sia). Sto recuperando da questo punto di vista seguendo vari tutoraggi su youtube, fatto sta che spesso e volentieri non riesco a trovare delle risposte esaustive alle mie domande.
La mia domanda riguarda le derivate di funzioni espresse in forma matriciale. Nel particolare stavo proprio ora studiando la derivazione degli OLS e relative soluzioni b0 e b1.
Andiamo con ordine; data una semplice regressione
Y= b0+b1xi1+...+bkxik+ei
riscritta in forma matriciale Y= Xb + e
vogliamo minimizzare l'errore tale che e = Y - Xb sia minimo
usando il quadrato di e, e^2 possiamo indicare in forma matriciale e^2 = (y-Xb)'(y-Xb)
da cui svolgendo le parentesi si ha y'y - y'Xb - yX'b' + X'b'Xb
il mio libro raccoglie come F = y'y - 2y'Xb + X'b'Xb
Domanda 1)
dicendo che - y'Xb ed - yX'b' sono scalari e quindi uguali... ma secondo quale regola raccoglie in -2y'Xb e non -2yX'b' ?
si procede dunque con la derivata di F rispetto a b
Domanda 2)
non capisco come la derivata di F possa essere -2yX' -2X'Xb
o meglio ho cercato di farmene una ragione avendo trovato delle regole di derivazione sul libro che sono:
1) dc'x / dx = c
2) dAx/dx = A'
3) dx'Ax/dx = 2Ax se A è simmetrica mentre = (A+A')x se non lo è
applicandole poco alla volta sulla F il risultato ovviamente esce, ma non riesco a trovare un procedimento che sia meno arbitrario o che segua un "algoritmo di derivazione" per arrivare al risultato.
Spero qualcuno sia in grado di aiutarmi un pochetto, grazie
La mia domanda riguarda le derivate di funzioni espresse in forma matriciale. Nel particolare stavo proprio ora studiando la derivazione degli OLS e relative soluzioni b0 e b1.
Andiamo con ordine; data una semplice regressione
Y= b0+b1xi1+...+bkxik+ei
riscritta in forma matriciale Y= Xb + e
vogliamo minimizzare l'errore tale che e = Y - Xb sia minimo
usando il quadrato di e, e^2 possiamo indicare in forma matriciale e^2 = (y-Xb)'(y-Xb)
da cui svolgendo le parentesi si ha y'y - y'Xb - yX'b' + X'b'Xb
il mio libro raccoglie come F = y'y - 2y'Xb + X'b'Xb
Domanda 1)
dicendo che - y'Xb ed - yX'b' sono scalari e quindi uguali... ma secondo quale regola raccoglie in -2y'Xb e non -2yX'b' ?
si procede dunque con la derivata di F rispetto a b
Domanda 2)
non capisco come la derivata di F possa essere -2yX' -2X'Xb
o meglio ho cercato di farmene una ragione avendo trovato delle regole di derivazione sul libro che sono:
1) dc'x / dx = c
2) dAx/dx = A'
3) dx'Ax/dx = 2Ax se A è simmetrica mentre = (A+A')x se non lo è
applicandole poco alla volta sulla F il risultato ovviamente esce, ma non riesco a trovare un procedimento che sia meno arbitrario o che segua un "algoritmo di derivazione" per arrivare al risultato.
Spero qualcuno sia in grado di aiutarmi un pochetto, grazie
