Regressione lineare

Silver101
Salve a tutti!
Avrei bisogno del vostro aiuto per risolvere esercizi di analisi di segnali.
Spero che possiate aiutarmi.

Il primo quesito che volevo proporvi riguarda la regressione lineare, si tratta di una domanda teorica che però non riesco a risolvere...

1) Si dica quali tra le seguenti espressioni descrive correttamente il legame tra il coefficiente angolare della retta, b, e il coefficiente di correlazione p tra la variabile dipendente e quella indipendente. Con x e y si indicano le deviazioni standard delle variabili indipendente e dipendente rispettivamente.

Si trattava di una domanda a risposta multipla e queste erano le soluzioni disponibili:

a) $ b=y/x $

b) $ b=p/x^2 $

c) $ b=p $

d) $ b=p*(y/x) $

d) $ b=p*(x/y) $

Io ho provato a mettere insieme le mie conoscenze di teoria ma non riesco a capire quale relazione vi sia..
So che il coefficiente di correlazione è una misura di quanto due variabili aleatorie X e Y siano allineate lungo la retta di regressione e che tale retta è espressa con la forma:

E(Y/X) = a+bx (dove in questo caso con x intendo la generica variabile e non la deviazione standard)

Inoltre so che il coefficiente di correlazione è espresso dalla relazione:

$ p= (covarianza(X,Y))/(devstdX*devstdY) $

Quale passaggio teorico mi manca per risolvere l'esercizio?

Risposte
Aliseo1
Ricordando che il coefficiente angolare $b=(Codev(X,Y))/(Dev(X))=(Cov(X,Y))/(Var(X))$ e che il coefficiente di correlazione $ p=(Codev(X,Y))/\sqrt(Dev(x)*Dev(Y))=(Cov(X,Y))/\sqrt(Var(X)*Var(Y)) $, dove $X$ è la variabile indipendente e $Y$ è la variabile dipendente, avrai che la risposta giusta è la ...

Silver101
... la d.

Quindi il passaggio che mi mancava era che il coefficiente angolare si può esprimere tramite quella relazione (segna subito sugli appunti :smt045 )

Ti ringrazio tantissimo.

Visto che ci sono colgo l'occasione per un altro quesito (che tra l'altro appartiene ancora alla stessa scheda del precedente... io e la regressione lineare non andiamo d'accordo.. ](*,) ).

Allora...

"Si supponga che l'errore abbia una deviazione standard pari a 5 e che il numero di campioni di y e x sia pari a 1000.
Nel caso si volessero determinare a priori gli estremi degli intervalli per la creazione dell'istogramma dell'errore, dire quali tra le seguenti è la coppia di valori più probabile."

Anche qui si avevano a disposizione le seguenti soluzioni:
1) 0 e 5
2) -15 e 15
3) -5 e 5
4) 0 e 1000

Ora, noi abbiamo affrontato la creazione di istogrammi soprattutto attraverso l'uso di matlab e procedevamo prendendo in considerazione il massimo e il minimo dei campioni e poi calcolando il numero approssimativo di intervalli tramite una funzione matematica del tipo $log2(n)+1$ arrotondandone il valore e a quel punto ripartivamo il numero degli intervalli così trovati tra i due estremi.
Applicando questo metodo uscirebbe la risposta 4.
Ma non credo possa essere giusto in quanto qui è richiesto l'istogramma dell'errore, inoltre viene fornita la deviazione standard che suppongo debba essere utilizzata.
Io ho ragionato così: poiché la deviazione standard mi esprime di quanto la mia misura si discosta dal valore atteso, posso dire che il mio errore oscillerà in un intervallo che va da -5 a 5 in quanto prendo in considerazione sia gli scostamenti "provenienti da sinistra" che quelli "provenienti da destra" (escludendo quindi l'opzione 0 e 5).
In questo modo però non tengo in considerazione il numero di campioni di x e y...
Ha senso questo ragionamento o sono fuori strada?

Grazie ancora e scusate il disturbo.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.