[Statistica] Come si usano queste tavole?
Ciao a tutti ragazzi!
mi direste come fare ad usare i valori presenti in queste tabelle?
http://lnx.mangaitalia.net/tavola1.pdf
http://lnx.mangaitalia.net/tavola2.pdf
purtroppo una mia amica mi ha chiesto come usarle, solo che io ho dato l'esame di statistica tre anni fa... e non ho più i libri per andare a recuperare la teoria e le formule...
è un esame di statistca fatto a medicina... io ho studiato calcolo e probabilità ad ingegneria... e questa tavole non capisco a che servano...
come andrebbero usati? insieme a quali formule?
ed i valori vanno sostituiti dove?
Grazieeeeee!
mi direste come fare ad usare i valori presenti in queste tabelle?
http://lnx.mangaitalia.net/tavola1.pdf
http://lnx.mangaitalia.net/tavola2.pdf
purtroppo una mia amica mi ha chiesto come usarle, solo che io ho dato l'esame di statistica tre anni fa... e non ho più i libri per andare a recuperare la teoria e le formule...
è un esame di statistca fatto a medicina... io ho studiato calcolo e probabilità ad ingegneria... e questa tavole non capisco a che servano...
come andrebbero usati? insieme a quali formule?
ed i valori vanno sostituiti dove?
Grazieeeeee!

Risposte
ciao rocco.g,
allora, trattasi delle tavole (rispettivamente) per la distribuzione $t$ di Student e $chi^2$ (Chi Quadrato)
gli usi possono essere molteplici..se la tua amica deve sostenere un esame per medicina ipotizzo debba far riferimento a:
Per la $t$ di Student:
- costruzione intervalli di confidenza per la media della popolazione con varianza ignota
- verifica di ipotesi sulla significatività di una variabile coinvolta in un modello di regressione
Per la $chi^2$:
- costruzione intervalli di confidenza per la varianza della popolazione
- verifica di ipotesi sulla varianza
lettura delle tavole:
$t$ di Student:
sulla prima colonna si trovano i $gdl$ (gradi di libertà) della variabile e sulla prima riga le probabilità di interesse. Nella tabella troviamo invece
i valori dei percentili della distribuzione in corrispondenza di varie combinazioni $gdl$/probabilità.
microesempio sugli intervalli di confidenza:
conosco la media campionaria $bar x$ e non conosco la varianza della popolazione $sigma^2$. Voglio costruire un intervallo di confidenza al livello $(1-alpha)%$ per la media
ignota della popolazione $mu$. Siccome non conosco la varianza della popolazione devo stimarla tramite la varianza campionaria $s^2$, e di conseguenza l'intervallo di
confidenza assumerà la forma
$bar x - t_(n-1,alpha)*s_(bar x) <= mu <= bar x + t_(n-1,alpha)*s_(bar x)$
dove $n$ è la numerosità del campione, $s_(bar x)$ è la stima dello scarto quadratico medio della media campionaria e $t_(n-1,alpha)$ è il percentile che leggi sulla tabella in corrispondenza di $n-1$ $gdl$ e probabilità pari ad $alpha$. dopodiché sostituisci e trovi l'intervallo.
nota: di solito la formula contempla $t_(n-1,alpha//2)$ anziché $t_(n-1,alpha)$ come ti ho scritto io, ma non vi è ambiguità, il motivo è unicamente per il fatto che la tavola che mi
hai linkato considera la somma delle probabilità sulle due code, e quindi 2 volte l'alpha delle tavole usuali (che sfruttano la simmetria di $t$ e ne considerano solo una di coda).
per la tabulazione della $chi^2$ la lettura è analoga, solo che ora devo scappare e non faccio in tempo a scriverti anche quello, dopo magari rimedio
spero di essere stato d'aiuto.
allora, trattasi delle tavole (rispettivamente) per la distribuzione $t$ di Student e $chi^2$ (Chi Quadrato)
gli usi possono essere molteplici..se la tua amica deve sostenere un esame per medicina ipotizzo debba far riferimento a:
Per la $t$ di Student:
- costruzione intervalli di confidenza per la media della popolazione con varianza ignota
- verifica di ipotesi sulla significatività di una variabile coinvolta in un modello di regressione
Per la $chi^2$:
- costruzione intervalli di confidenza per la varianza della popolazione
- verifica di ipotesi sulla varianza
lettura delle tavole:
$t$ di Student:
sulla prima colonna si trovano i $gdl$ (gradi di libertà) della variabile e sulla prima riga le probabilità di interesse. Nella tabella troviamo invece
i valori dei percentili della distribuzione in corrispondenza di varie combinazioni $gdl$/probabilità.
microesempio sugli intervalli di confidenza:
conosco la media campionaria $bar x$ e non conosco la varianza della popolazione $sigma^2$. Voglio costruire un intervallo di confidenza al livello $(1-alpha)%$ per la media
ignota della popolazione $mu$. Siccome non conosco la varianza della popolazione devo stimarla tramite la varianza campionaria $s^2$, e di conseguenza l'intervallo di
confidenza assumerà la forma
$bar x - t_(n-1,alpha)*s_(bar x) <= mu <= bar x + t_(n-1,alpha)*s_(bar x)$
dove $n$ è la numerosità del campione, $s_(bar x)$ è la stima dello scarto quadratico medio della media campionaria e $t_(n-1,alpha)$ è il percentile che leggi sulla tabella in corrispondenza di $n-1$ $gdl$ e probabilità pari ad $alpha$. dopodiché sostituisci e trovi l'intervallo.
nota: di solito la formula contempla $t_(n-1,alpha//2)$ anziché $t_(n-1,alpha)$ come ti ho scritto io, ma non vi è ambiguità, il motivo è unicamente per il fatto che la tavola che mi
hai linkato considera la somma delle probabilità sulle due code, e quindi 2 volte l'alpha delle tavole usuali (che sfruttano la simmetria di $t$ e ne considerano solo una di coda).
per la tabulazione della $chi^2$ la lettura è analoga, solo che ora devo scappare e non faccio in tempo a scriverti anche quello, dopo magari rimedio

spero di essere stato d'aiuto.
sei stato d'aiuto!
grazieee!!!
solo che c'è un problema: io l'ho capita, ma a lei come gliela spiego... cioè secondo me loro non posso veramente usare tutti quei passaggi... sul loro libro c'era ben poco...
cmq il senso credo di averlo recepito...
grazieee!!!
solo che c'è un problema: io l'ho capita, ma a lei come gliela spiego... cioè secondo me loro non posso veramente usare tutti quei passaggi... sul loro libro c'era ben poco...
cmq il senso credo di averlo recepito...
rieccomi
il problema è spiegargliela dici? uhmm
prova con un esempio...me ne invento uno ora vediamo un po'..
siamo andati a misurare la temperatura corporea di $n=6$ bambini della scuola elementare PincoPallo nell'ambito di una indagine sulla incidenza della febbre in questa scuola. Vogliamo essere in grado di poter individuare, commettendo al più un errore del $5%$ ($1-alpha=1-0.05=0.95$), un intervallo in cui la vera (ma ignota!) temperatura media ($mu$) corporea dell'intera popolazione di interesse (studenti della scuola) possa trovarsi.
Non conosciamo la variabilità vera della popolazione ($sigma^2$) e dunque dobbiamo stimarla.
I dati sono: $(37,36.8,36.4,37.2,36.7,36.1)$
calcoliamo la media campionaria:
$bar x = 1/n*sum_(i=1)^6 x_i = (37+36.8+36.4+37.2+36.7+36.1)/6 = 36.7$
la varianza campionaria è
$s^2 = 1/(n-1) * sum_(i=1)^6 (x_i - bar x)^2 = 0.16$ ----> $s=sqrt(s^2)=sqrt(0.16)=0.4$
possiamo quindi calcolare la quantità $s_(bar x) = s/sqrt(n) = 0.4/sqrt(6) ~= 0.1634$
cerchiamo inoltre sulle tavole $t_(n-1,alpha)=t_(6-1,0.05)=t_(5,0.05)=2.571$, ovvero il percentile in corrispondenza di 5 $gdl$ e $alpha=0.05$
a questo punto possiamo costruire l'intervallo di confidenza, che deve avere forma $bar x \pm t_(n-1,alpha)*s_(bar x)$
ovvero, sostituendo in
$bar x - t_(n-1,alpha)*s_(bar x)<=mu<=bar x + t_(n-1,alpha)*s_(bar x)$
abbiamo
$36.7 - 2.571*0.1634 = 36.2799 <= mu <=36.7 + 2.571*0.1634=37.1201$
cioé
$36.2799 <= mu <=37.1201$
ovvero siamo confidenti al 95% che la temperatura media corporea dei bambini (tutti i bambini!) della scuola PincoPallo sarà compresa approssimativamente fra $36.3$ e $37.1$.
salvo errori ed omissioni.
il problema è spiegargliela dici? uhmm
prova con un esempio...me ne invento uno ora vediamo un po'..
siamo andati a misurare la temperatura corporea di $n=6$ bambini della scuola elementare PincoPallo nell'ambito di una indagine sulla incidenza della febbre in questa scuola. Vogliamo essere in grado di poter individuare, commettendo al più un errore del $5%$ ($1-alpha=1-0.05=0.95$), un intervallo in cui la vera (ma ignota!) temperatura media ($mu$) corporea dell'intera popolazione di interesse (studenti della scuola) possa trovarsi.
Non conosciamo la variabilità vera della popolazione ($sigma^2$) e dunque dobbiamo stimarla.
I dati sono: $(37,36.8,36.4,37.2,36.7,36.1)$
calcoliamo la media campionaria:
$bar x = 1/n*sum_(i=1)^6 x_i = (37+36.8+36.4+37.2+36.7+36.1)/6 = 36.7$
la varianza campionaria è
$s^2 = 1/(n-1) * sum_(i=1)^6 (x_i - bar x)^2 = 0.16$ ----> $s=sqrt(s^2)=sqrt(0.16)=0.4$
possiamo quindi calcolare la quantità $s_(bar x) = s/sqrt(n) = 0.4/sqrt(6) ~= 0.1634$
cerchiamo inoltre sulle tavole $t_(n-1,alpha)=t_(6-1,0.05)=t_(5,0.05)=2.571$, ovvero il percentile in corrispondenza di 5 $gdl$ e $alpha=0.05$
a questo punto possiamo costruire l'intervallo di confidenza, che deve avere forma $bar x \pm t_(n-1,alpha)*s_(bar x)$
ovvero, sostituendo in
$bar x - t_(n-1,alpha)*s_(bar x)<=mu<=bar x + t_(n-1,alpha)*s_(bar x)$
abbiamo
$36.7 - 2.571*0.1634 = 36.2799 <= mu <=36.7 + 2.571*0.1634=37.1201$
cioé
$36.2799 <= mu <=37.1201$
ovvero siamo confidenti al 95% che la temperatura media corporea dei bambini (tutti i bambini!) della scuola PincoPallo sarà compresa approssimativamente fra $36.3$ e $37.1$.
salvo errori ed omissioni.