Retta di regressione
Ciao, ho un dubbio per quanto riguarda il calcolo della retta di regressione. In particolare il modello presume lo studio della dipendenza in media tra una variabile dipendente (in genere Y) e una indipendente (in genere X). Allorché il calcolo del coefficiente angolare della retta di regressione secondo il metodo dei minimi quadrati è:
$b= (CODEV X, Y)/(DEV X) $
Ossia la codevianza fratto la devianza della variabile indipendente.
Ora, molto spesso l'esercizio non esplicita quale dei due è dipendente o indipendente. Magari è una domanda stupida ma forse mi sono perso qualcosa, devo fare qualche osservazione particolare? Cambia qualcosa? Ad es. ho il seguente esercizio
$b= (CODEV X, Y)/(DEV X) $
Ossia la codevianza fratto la devianza della variabile indipendente.
Ora, molto spesso l'esercizio non esplicita quale dei due è dipendente o indipendente. Magari è una domanda stupida ma forse mi sono perso qualcosa, devo fare qualche osservazione particolare? Cambia qualcosa? Ad es. ho il seguente esercizio
- X= 7.7, 3.3, 6.1, 3.4, 7.4, 5.2, 8.8[/list:u:jelxmdb9]
- Y= 30, 15, 21, 18, 25, 16, 35[/list:u:jelxmdb9]
La cui retta di regressione potrei tranquillamente calcolare con la formula di sopra, ma al denominatore ci metto la devianza di X o di Y? Magari ci sto pensando troppo su.
Grazie.
Risposte
Beh, l'hai detto tu qui:
"carpox":
[...] una variabile dipendente (in genere Y) e una indipendente (in genere X).
"gugo82":[/quote]
Beh, l'hai detto tu qui:
[quote="carpox"][...] una variabile dipendente (in genere Y) e una indipendente (in genere X).
Avrei solo un dubbio. Sono andato avanti negli studi ultimando il programma con il modello di regressione lineare. Questo in pratica presuppone che una dei valori sia deterministico mentre in statistica descrittiva si parla semplicemente di variabile (dipendente/dipendente).
Non ho ben capito la differenza tra il modello di regressione lineare studiato in statistica inferenziale e il la regressione della statistica descrittiva. Entrambi arrivano alla retta di regressione nel medesimo modo, tuttavia sembra che alcune ipotesi da fare siano differenti.
Nel caso sueposto, a cosa ci si riferisce?
Grazie.
"carpox":
In particolare il modello presume lo studio della dipendenza [strike]in media[/strike] lineare tra una variabile dipendente (in genere Y) e una indipendente (in genere X).
Sarò breve (dico sempre così)
Presi due caratteri, qualitativi o quantificabili, possiamo sempre creare una tabella a doppia entrata e utilizzare diverse statistiche per misurarne la dipendenza. Sic et simpliciter.
Se sono variabili quantificabili, possiamo studiare, ad esempio, le medie aritmetiche condizionate e vedere se sono in dipendenza fra di loro.
Quindi riassumendo, se vi è dipendenza fra due variabili quantitative, potrebbe esserci anche una dipendenza in media. Il viceversa non vale. Due variabili, possono essere dipendenti ma non dipendenti in media.
Il passo successivo (assumendo che vi sia una dipendenza in media) è valutare se queste medie condizionate possano essere inserite in modello lineare (la retta di regressione). Se è così, allora parliamo di dipendenza lineare delle medie condizionate.
Riassumendo, possiamo riassumere schematicamente la dipendenza delle variabili quantificabili in:
Dipendenza --> dipendenza in media --> dipendenza lineare
Il verso non è reversibile.
Infine, la scelta di quale variabile sia indipendente nasce dal buon senso dello statistico. Matematicamente, tutto è possibile.