Regressione e pressione massima

krak2
Ciao a tutti,
desideravo un aiuto circa un esercizio.

Avendo i seguenti valori:
Età Pressioni massime
25 115
30 120
35 130
40 125
45 145
50 150
53 155

Mi sono calcolato il coefficiente di correlazione che mi risulta: 0,959462 .
Poi la retta di regressione lineare che risulta
y= 1,4509x + 76,663
.
Adesso dovrei stimare la pressione massima di un individuo di 37 anni.
Concretamente, qualcuno può dirmi cosa dovrei fare adesso? Devo sostituire alla x il valore 37 e ricavarmi la y?
Grazie per l' aiuto.

Risposte
Fabietto86
Sì basta basta porre \( x=37 \).

krak2
Quindi la pressione massima è :
y= 130,3463 giusto?

krak2
Un altro punto dice:
Stimare l'età di un individuo la cui pressione arteriosa massima è 152.

Dovrei partire sempre dalla retta che è \(\displaystyle y=1,4509x + 76,663 \), ho già calcolato nel punto precedente che la \(\displaystyle y=130,3463 \) .
Adesso per calcolarmi l'età come dovrei fare? cosa devo andare a sostituire?
Grazie.

Arado90
Se $y$ è la pressione ed $x$ l'età mi sembra ovvio che:
$152=1.4509x+76.663$ risolta rispetto ad $x$ ti dà l'età.

krak2
Grazie mille.
Avevo sbagliato, facendo i vari passaggi al posto di mettere - avevo messo + e di conseguenza come età mi risultava 157 anni, che non poteva essere..
Grazie ancora :smt023

krak2
Dati i seguenti dati:
1,72
1,82
1,95
2,01
0,99
1,95
1,85
1,76
1,63
1,81

Calcolare un intervallo di confidenza per la media di livello 95% e 90%, supponendo che i dati siano estratti da una popolazione con distribuzione normale di parametri incogniti \(\displaystyle \mu \) e \(\displaystyle \sigma \).

Prima di tutto ho calcolato la media che viene: \(\displaystyle 1,749 \).
Poi ho calcolato anche la deviazione standard che viene: \(\displaystyle 0,275515879 \).

Dopo di che ho applicato la seguente formula:

\(\displaystyle [x-(t_{\frac{\alpha }{2}, n-1} * \frac{\sigma }{\sqrt{n}}); x+(t_{\frac{\alpha }{2}, n-1} * \frac{\sigma }{\sqrt{n}})] \)

Per \(\displaystyle \alpha =95% \), ho che \(\displaystyle t_{\frac{\alpha }{2}, n-1}= 1,833 \) e quindi l'intervallo di confidenza che mi risulta è:
\(\displaystyle (1,58298462; 1,638701538) \).

Per \(\displaystyle \alpha =90% \), ho che \(\displaystyle t_{\frac{\alpha }{2}, n-1}= 1,383 \) e quindi l'intervallo di confidenza che mi risulta è:
\(\displaystyle (1,628505059; 1,869494941) \).

Qualcuno mi sa dire se i calcoli sono giusti?
Sempre grazie.

Arado90
1. Sicuro che la 5^ osservazione sia $0.99$ e non piuttosto $1.99$? Mi sembra un dato un po' anomalo rispetto agli altri.

2. Il primo intervallo è sicuramente errato e dovresti accorgertene subito senza neppure fare calcoli: hai detto te stesso che la media è $1.749$ e quell'intervallo non contiene tale valore.

Comunque entrambi gli intervalli sono errati. Ad occhio dipende dai valori errati di $t$ che hai utilizzato: $t_{0.05/2,9}=2.262$ e $t_{0.1/2,9}=1.833$

krak2
1. Ho controllato nuovamente il testo ed il valore scritto è quello.

Hai ragione, ho sbagliato i due valori di \(\displaystyle t \).

Ne approfitto per chiederti una delucidazione:
Qual'è la differenza tra questa formula:
\(\displaystyle [x-(t_{\frac{\alpha }{2}, n-1} * \frac{\sigma }{\sqrt{n}}); x+(t_{\frac{\alpha }{2}, n-1} * \frac{\sigma }{\sqrt{n}})] \) ,
e questa: \(\displaystyle [x-(z_{\frac{\alpha }{2}} * \frac{\sigma }{\sqrt{n}}); x+(z_{\frac{\alpha }{2}} * \frac{\sigma }{\sqrt{n}})] \)
Cioè quando si usa l'una o l'altra?

Ti ringrazio infinitamente per l'aiuto che mi stai dando :oops:

Arado90
I quantili della Normale standard ($z_{alpha/2}$) li usi quando la varianza è nota; i quantili della t-Student ($t_{alpha/2}$) quando invece la varianza non è nota come in questo caso.

In realtà se la numerosità è abbastanza alta (generalmente $n>30$) puoi usare sempre i quantili della Normale, indipendentemente dalla varianza.

krak2
Grazie mille ancora per l'aiuto, sei stato chiarissimo.
Se ho altri dubbi scrivo qua.

krak2
Stavo facendo questo esercizio ma non capisco dove sbaglio.
Considerando la tabella dei carichi relativa ad un campione di n=15.
Supponiamo che detto campione sia estratto da una popolazione con distribuzione normale di parametri incogniti \(\displaystyle \mu \) e \(\displaystyle \sigma \).

4650
4650
4700
4750
4775
4775
4800
4950
5050
5100
5100
5150
5175
5250
5300

a) Calcolare l'intervallo di confidenza per \(\displaystyle \mu \) con livello di fiducia \(\displaystyle \alpha =0,001 \).
Questo intervallo sarà \(\displaystyle [X_{15}-t_{1-\frac{\alpha }{2}}\frac{S_{15}}{\sqrt{15}}, X_{15}+t_{1-\frac{\alpha }{2}}\frac{S_{15}}{\sqrt{15}}] \)

Per prima cosa, ho calcolato la media che risulta: 4945.
Dopo ho calcolato la varianza
4650-4945=\(\displaystyle (295^{2}) \)=87025
4650-4945=\(\displaystyle (295^{2}) \)=87025
4700-4945=\(\displaystyle (245^{2}) \)=60025
4750-4945=\(\displaystyle (195^{2}) \)=38025
4775-4945=\(\displaystyle (170^{2}) \)=28900
4775-4945=\(\displaystyle (170^{2}) \)=28900
4800-4945=\(\displaystyle (145^{2}) \)=21025
4950-4945=\(\displaystyle (5^{2}) \)=25
5050-4945=\(\displaystyle (105^{2}) \)=11025
5100-4945=\(\displaystyle (155^{2}) \)=24025
5100-4945=\(\displaystyle (155^{2}) \)=24025
5150-4945=\(\displaystyle (205^{2}) \)=42025
5175-4945=\(\displaystyle (230^{2}) \)=52900
5250-4945=\(\displaystyle (305^{2}) \)=93025
5300-4945=\(\displaystyle (355^{2}) \)=126025

Che sommando tutti questi numeri ottenuti e dividendo il risultato per 15,
la varianza mi risulta: 48266,66667
e la deviazione standard(radice quadrata della varianza) : 219,6967607.

Ora, calcolandomi la varianza e dev standard con excel i due risultati non coincidono, perchè excel mi dice che la varianza risulta: 51714,28571
e la dev standard : 227,4077521

Cosa sbaglio? Qualcuno può aiutarmi gentilmente? :(
grazie

krak2
Ciao, si hai ragione calcolando con VAR.POP il mio valore adesso coincide.
Ma quindi è giusto come ho calcolato io la varianza?

Adesso dovrei calcolare l'intervallo di confidenza:
\(\displaystyle [X_{15}-t_{1-\frac{\alpha }{2}}\frac{S_{15}}{\sqrt{15}}, X_{15}+t_{1-\frac{\alpha }{2}}\frac{S_{15}}{\sqrt{15}}] \)

Per prima cosa dovrei calcolarmi il valore di \(\displaystyle t_{1-\frac{\alpha }{2}} \)
So che la mia \(\displaystyle \alpha =0,01 \) ,
quindi \(\displaystyle 1-\frac{\alpha }{2}= 1-(\frac{0,01}{2})=0,995 \)
Adesso vado a cercarmi il valore 0,995 nella tabella della distribuzione normale, che si trova alla riga 2,6 e colonna 0,00.
Quindi il valore di t dovrebbe essere 2,60.
E' giusto come ragionamento? o è sbagliato calcolarmi t in questo modo?
Grazie anticipatamente.

Arado90
Perché cerchi il valore di $t$ nella tabella della Normale? :lol:

krak2
Perchè il testo dice: "Supponiamo che detto campione sia estratto da una popolazione con distribuzione normale di parametri incogniti \(\displaystyle \mu \) e \(\displaystyle \sigma \).
E' sbagliato come l'ho calcolato t? :oops:

Arado90
Ok, la popolazione è normale, però la varianza è ignota. Quindi devi usare la t-Student.

krak2
So che la mia \(\displaystyle \alpha =0,01 \).
Mi calcolo \(\displaystyle \frac{\alpha }{2}= \frac{0,01}{2}= 0,005 \).
Quindi la \(\displaystyle t_{(\frac{\alpha }{2}; n-1)}= t_{0,005; 14} \).
Andando adesso a cercare alla colonna 0,005 e riga 14, la tabella mi dice che il valore della \(\displaystyle t=2,977 \).

Adesso sapendo che:
media campionaria= \(\displaystyle 4945 \)
deviaz standard= \(\displaystyle 219,6967607 \)
mi vado a calcolare l'intervallo di confidenza:
\(\displaystyle [4945-(2,977 * \frac{219,6967607}{15}); 4945+(2,977 * \frac{219,6967607}{15})] \)
Facendo tutti i vari calcoli ottengo \(\displaystyle (4901;4988) \)

quando invece dovrebbe risultare: (4770;5120).
Cosa è che non va? cosa sbaglio? :(

Arado90
Hai diviso per $15$ e non per $sqrt(15)$

Rggb1
Scusate ho un po' di annebbiamento - magari è fame, devo andare a cena - ma non si dovrebbe usare la varianza corretta e confrontarla con una t-Student con 14 gradi di libertà? :?

Arado90
Infatti sta usando la t-Student con $14$ df :lol:
La varianza però non è "corretta" e in effetti facendo i calcoli (con $sqrt(15)$ al posto di $15$) esce $(4776,5114)$.
Quindi sì, conviene usare la varianza corretta.

Rggb1
"Arado90":
Infatti sta usando la t-Student con $14$ df :lol:

Ho visto, grazie ;), ma non era questo il punto: usa lo stimatore distorto.

"Arado90":
Quindi sì, conviene usare la varianza corretta.

"Conviene"?

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.