Differenza tra medie per dati appaiati esercizio poco chiaro
salve ragazzi, allora è tutto il pomeriggio che mi scervello su questo esercizio.. ma mi sovviene il dubbio che il prof abbia sbagliato qualcosa perché c'è un dato che proprio non capisco dove lo tira fuori!! questo è il testo:
si esegue un test su 7 orsi, trovando media campionaria $x=183$ e varianza campionaria $s^2_x=500$. dopo un anno si rieffettua il test sugli stessi orsi trovando media campionaria $y=100$ e varianza campionaria $s^2_y=400$. verificare con livello $alpha=0.05$ le ipotesi:
$H_0: mu_1=mu2$ e $H_1: mu_1$ diverso $mu_2$
ora la formula sarebbe:
$T= (x-y)/(s/sqrt(n))$
il problema è che non so che $s^2$ usare... avevo pensato che essendo sempre lo stesso n, bastasse far la media delle varianze campionarie... però il prof omettendo tutti i passaggi, mette $s^2=440$ e non cpaisco proprio da dove salti fuori questo 440!!! ho provato a cercare su internet, ma ho trovato altre formule che sembrano invece dare ragione all'idea di fare la media e avere 450 quindi...però lui continua i calcoli con 440 e alla fine trova
T=10.46... e rifiuta il valore (cofrontando con la t di student delle tabelle).. ma il mio problema è il 440.... non so come fare, negli altri esercizi dava solo una varianza da usare.. qua ce ne sono 2...
si esegue un test su 7 orsi, trovando media campionaria $x=183$ e varianza campionaria $s^2_x=500$. dopo un anno si rieffettua il test sugli stessi orsi trovando media campionaria $y=100$ e varianza campionaria $s^2_y=400$. verificare con livello $alpha=0.05$ le ipotesi:
$H_0: mu_1=mu2$ e $H_1: mu_1$ diverso $mu_2$
ora la formula sarebbe:
$T= (x-y)/(s/sqrt(n))$
il problema è che non so che $s^2$ usare... avevo pensato che essendo sempre lo stesso n, bastasse far la media delle varianze campionarie... però il prof omettendo tutti i passaggi, mette $s^2=440$ e non cpaisco proprio da dove salti fuori questo 440!!! ho provato a cercare su internet, ma ho trovato altre formule che sembrano invece dare ragione all'idea di fare la media e avere 450 quindi...però lui continua i calcoli con 440 e alla fine trova
T=10.46... e rifiuta il valore (cofrontando con la t di student delle tabelle).. ma il mio problema è il 440.... non so come fare, negli altri esercizi dava solo una varianza da usare.. qua ce ne sono 2...
Risposte
[xdom="speculor"]Sposto in Statistica e probabilità.[/xdom]
Ciao,
non capisco come trattere i tuoi dati.
Ovviamente si ipotizza che la popolazione di provenienza del campione sia normale (cond. necessaria per app il test t) e che la varianza sia incognita. La numerosità del campione poi non è che sia il massimo...
Cmq il punto che non mi torna è come utilizzare le var. campionarie proprio in questo caso dove i dati sono appaiati. Per calcolare la differenza delle varianze sui dati per me dovremmo conoscere almeno le differenze su ogni coppia. A meno di qualche trucco di calcolo con campioni appaiati la vedo dura (se fossero indipendenti non ci sarebbero prob.).
Mi illumini sul calcolo che hai fatto per trovare 450?
non capisco come trattere i tuoi dati.
Ovviamente si ipotizza che la popolazione di provenienza del campione sia normale (cond. necessaria per app il test t) e che la varianza sia incognita. La numerosità del campione poi non è che sia il massimo...
Cmq il punto che non mi torna è come utilizzare le var. campionarie proprio in questo caso dove i dati sono appaiati. Per calcolare la differenza delle varianze sui dati per me dovremmo conoscere almeno le differenze su ogni coppia. A meno di qualche trucco di calcolo con campioni appaiati la vedo dura (se fossero indipendenti non ci sarebbero prob.).
Mi illumini sul calcolo che hai fatto per trovare 450?
la mia prima ipotesi è stata fare brutalmente la media delle varianze campionarie.... però mi sembrava troppo semplice, allora ho applicato la formula della varianza mediata:
$s^-2= [(n_1-1)*s_x^2+(n_2-1)^2*s_y^2]/(n_1+n_2-2)$
dove ovviamente $n_1=n_2=7$ e applicando anche questa formula mi tornava $s^-2=450$
io ho solo una formula negli appunti del prof per il tipo di problema che mi ha dato ed è:
$s^2= Sigma (x_k-y_k)^2/(n-1)$
il problema è che da quel che ho capito la mia $x$ è giàa la somma di tutte le $x_k$ e idem per $x_k$ e se faccio $(x-y)/(n-1)$ mi risulta $s_z^2=13.83$ e da come l'ha risolto lui non va bene.
lui praticamente per risolverlo scrive:
${x_k-y_k}$ con k che va da 1 a 7
diche che è uguale a ${z_k}$ semore con k da 1 a 7 poi dice
$z_k$ circa uguale a $N(0; sigma^2)$
scrive le due ipotesi che vi ho detto $H_0$ e $H_1$ e fa $s_z^2= 1/(n-1) Sigma (z_k-z)^2= 1/(n-1) Sigma (x_k-y_k-x+y)^2$
e da li trova $s_z^2=440$
però non ha fatto i passaggi.. e io non so cosa sia sta roba.. sembra appunto la media del campione... ma essendo 2 dati dovrei fare la media dei dati... ma in ogni caso mi viene 450....
non capisco!! ho provato ad andare avanti a vedere se scriveva solo 440 e poi usava 450 ma invece nei calcoli ha proprio usato 440!!!
$s^-2= [(n_1-1)*s_x^2+(n_2-1)^2*s_y^2]/(n_1+n_2-2)$
dove ovviamente $n_1=n_2=7$ e applicando anche questa formula mi tornava $s^-2=450$
io ho solo una formula negli appunti del prof per il tipo di problema che mi ha dato ed è:
$s^2= Sigma (x_k-y_k)^2/(n-1)$
il problema è che da quel che ho capito la mia $x$ è giàa la somma di tutte le $x_k$ e idem per $x_k$ e se faccio $(x-y)/(n-1)$ mi risulta $s_z^2=13.83$ e da come l'ha risolto lui non va bene.
lui praticamente per risolverlo scrive:
${x_k-y_k}$ con k che va da 1 a 7
diche che è uguale a ${z_k}$ semore con k da 1 a 7 poi dice
$z_k$ circa uguale a $N(0; sigma^2)$
scrive le due ipotesi che vi ho detto $H_0$ e $H_1$ e fa $s_z^2= 1/(n-1) Sigma (z_k-z)^2= 1/(n-1) Sigma (x_k-y_k-x+y)^2$
e da li trova $s_z^2=440$
però non ha fatto i passaggi.. e io non so cosa sia sta roba.. sembra appunto la media del campione... ma essendo 2 dati dovrei fare la media dei dati... ma in ogni caso mi viene 450....
non capisco!! ho provato ad andare avanti a vedere se scriveva solo 440 e poi usava 450 ma invece nei calcoli ha proprio usato 440!!!
Grazie del chiarimento.
infatti questo è valido solo per campioni indipendenti con stesso rango.
esatto il calcolo della varianza cam. delle differenze è proprio questo
ed ancora...
infatti non mi torna proprio questo fatto. O il testo dell'esercizio è sbaglio, o il tuo prof. si è sbagliato, oppure ci sono dei metodi di calcolo differenti. Mi documento e ti faccio sapere (se nessuno risponde prima..), 'sta cosa deve tornare.
"Aint":
la mia prima ipotesi è stata fare brutalmente la media delle varianze campionarie.... però mi sembrava troppo semplice, allora ho applicato la formula della varianza mediata:
$s^-2= [(n_1-1)*s_x^2+(n_2-1)^2*s_y^2]/(n_1+n_2-2)$
dove ovviamente $n_1=n_2=7$ e applicando anche questa formula mi tornava $s^-2=450$
infatti questo è valido solo per campioni indipendenti con stesso rango.
io ho solo una formula negli appunti del prof per il tipo di problema che mi ha dato ed è:
$s^2= Sigma (x_k-y_k)^2/(n-1)$
esatto il calcolo della varianza cam. delle differenze è proprio questo
il problema è che da quel che ho capito la mia $x$ è giàa la somma di tutte le $x_k$ e idem per $x_k$ e se faccio $(x-y)/(n-1)$ mi risulta $s_z^2=13.83$ e da come l'ha risolto lui non va bene.
ed ancora...
infatti non mi torna proprio questo fatto. O il testo dell'esercizio è sbaglio, o il tuo prof. si è sbagliato, oppure ci sono dei metodi di calcolo differenti. Mi documento e ti faccio sapere (se nessuno risponde prima..), 'sta cosa deve tornare.
grazie... nel caso sia sbagliato come ha fatto me lo puoi risolvere come si deve?? così almeno so se quello che faccio lo faccio bene e se mi tornano i numeri...
in teoria come l'ha risolto lui rifiuta le ipotesi al 5% e anche all'1%
in teoria come l'ha risolto lui rifiuta le ipotesi al 5% e anche all'1%
"hamming_burst":
infatti non mi torna proprio questo fatto. O il testo dell'esercizio è sbaglio, o il tuo prof. si è sbagliato, oppure ci sono dei metodi di calcolo differenti.
La cosa ha incuriosito anche me... ho provato con tutti i metodi che conosco e una varianza di 440 proprio non mi viene (la pooled vale 450, come già calcolato). Proverò ancora, se avete novità postate.
Suggerisco anche una domanda di chiarimento al docente.
a questo punto direi che con alta probabilità possiamo dire che si è sbagliato il prof =)
dunque il modo giusto di risolverlo è fare la pooled variance (e in questo caso dunque la media delle varianze visto che n è sempre lo stesso) e usare quella come $s^2_z$
dunque il modo giusto di risolverlo è fare la pooled variance (e in questo caso dunque la media delle varianze visto che n è sempre lo stesso) e usare quella come $s^2_z$
"Aint":
a questo punto direi che con alta probabilità possiamo dire che si è sbagliato il prof =)
il prof AND l'esercizio
Ho guardato alcune dispense e qualche libro, non ho trovato una formula per dati appaiati conoscendo SOLO le varianze campionare di ogni campionamento, senza i dati singoli. Se anche Rggb non ha trovato risposta vuol dire che tale formula non esiste e conferma che il prof ha sbagliato (salvo smentita).
Perciò:
dunque il modo giusto di risolverlo è fare la pooled variance (e in questo caso dunque la media delle varianze visto che n è sempre lo stesso) e usare quella come $s^2_z$
il problema e il test cambiano di significato. Ipotizziamo allora che che i campioni siano stati raccolti su 7 orsi differenti ed indipendentemente (anche nel tempo se si vuole).
guarda, l'unico esercizio simile che ci ha dato era già con le differenze di media X e Y e con UNA varianza campionaria.. e quindi dopo avendo n come dato era sol oda applicare la formula...
per questo sono rimasto "sconvolto" dall'avere 2 varianze campionarie...
l'esercizio penso se lo sia inventato... (il testo)...
ma quindi cioè, fingendo che X sia già la differenza dei dati del prima e Y la differenza dei dati del dopo (dovrebbe intendere questo l'esercizio)
c'è un qualche modo per risolverlo??? insomma c'è un modo di lavorare con questi dati? o.O altrimenti posso fare l'assunzione del 450???
per questo sono rimasto "sconvolto" dall'avere 2 varianze campionarie...
l'esercizio penso se lo sia inventato... (il testo)...
ma quindi cioè, fingendo che X sia già la differenza dei dati del prima e Y la differenza dei dati del dopo (dovrebbe intendere questo l'esercizio)
c'è un qualche modo per risolverlo??? insomma c'è un modo di lavorare con questi dati? o.O altrimenti posso fare l'assunzione del 450???
@aint
Scusa, mi è rimasta la curiosità... hai chiesto chiarimenti al docente? Perché mi sembrava il sistema migliore per dissipare i dubbi.
Scusa, mi è rimasta la curiosità... hai chiesto chiarimenti al docente? Perché mi sembrava il sistema migliore per dissipare i dubbi.
"Aint":
ma quindi cioè, fingendo che X sia già la differenza dei dati del prima e Y la differenza dei dati del dopo (dovrebbe intendere questo l'esercizio)
quello che hai scritto non ha senso, come fai a fare la differenza e separare le varianze (come detto a meno di un trick di calcolo non è possibile farlo). quelle sono le varianze campionare dei due campioni indipendenti (assumiamo lo siano).
c'è un qualche modo per risolverlo??? insomma c'è un modo di lavorare con questi dati? o.O altrimenti posso fare l'assunzione del 450???
fai la differenza della media di due campioni indipendenti di rango uguale, con stessa varianza delle popolazioni ignota (è più facile ipotizzare in questo modo). In pratica è quello che hai fatto.
concordo con l'Rggb, sarebbe interessante fissare i dubbi chiedendo al docente.
"Rggb":
@aint
Scusa, mi è rimasta la curiosità... hai chiesto chiarimenti al docente? Perché mi sembrava il sistema migliore per dissipare i dubbi.
il prof ha semplicemente detto che era un esempio e di non preoccuparsi che così all'esame non ce ne saranno...
.-.
"Aint":
[quote="Rggb"]@aint
Scusa, mi è rimasta la curiosità... hai chiesto chiarimenti al docente? Perché mi sembrava il sistema migliore per dissipare i dubbi.
il prof ha semplicemente detto che era un esempio e di non preoccuparsi che così all'esame non ce ne saranno...
.-.[/quote]

Secondo me si è inventato pure 'na scusa per pararsi un po'. Perciò date due varianze campionare non si possono applicare i concetti di campioni appaiati.
"hamming_burst":
[quote="Aint"][quote="Rggb"]@aint
Scusa, mi è rimasta la curiosità... hai chiesto chiarimenti al docente? Perché mi sembrava il sistema migliore per dissipare i dubbi.
il prof ha semplicemente detto che era un esempio e di non preoccuparsi che così all'esame non ce ne saranno...
.-.[/quote]

Secondo me si è inventato pure 'na scusa per pararsi un po'. Perciò date due varianze campionare non si possono applicare i concetti di campioni appaiati.[/quote]
guarda, nella mia università è un miracolo che già rispondano alle mail... ci sono prof che sono completamente assenti oltre l'orario di lezione...vabbé comunque l'esame l'ho fatto e brillantemente superato =)
"Aint":
il prof ha semplicemente detto che era un esempio e di non preoccuparsi che così all'esame non ce ne saranno...

Lasciamo perdere: ha fatto un errore e ha 'sorvolato' con molta nonscialance (sic).

BTW:
"Aint":
vabbé comunque l'esame l'ho fatto e brillantemente superato =)
Congrats.