Come calcolare t-value della t-table
Salve a tutti, da qualche giorno mi sto appassionando al mondo della statistica e mi sono imbattuto in un simpatico dilemma: come si calcolano i valori di una t-table ? mi riferisco al calcolo degli intervalli di confidenza dove per l'appunto viene introdotto il valore di t prelevandolo da apposita tabella incrociando i valori della percentuale di confidenza (una o due code) e i gradi di libertà. Ho trovato del materiale in rete ma onestamente non essendo un matematico mi sono fermato quando ho letto che trattasi di più passaggi e che il primo sia inerente ad una beta funzione. Vi chiedo, è possibile avere un esempio di come si possa arrivare passo passo ad un valore di t pari a 1,984 con il 95% di confidenza (due code, scritto così nella tabella da cui riporto) e 100 gradi di libertà ? spero di non avere violato i 3/4 del regolamento, nel caso sorry sono niubbo del forum.
Risposte
"tokenring":
... Vi chiedo, è possibile avere un esempio di come si possa arrivare passo passo ad un valore di t pari a 1,984 con il 95% di confidenza (due code, scritto così nella tabella da cui riporto) e 100 gradi di libertà ?
Devi risolvere la seguente equazione:
$int_(-oo)^(t)(Gamma(101/2))/(10sqrt(pi)Gamma(100/2))[1+x^2/100]^(-(101)/2)dx=0.975$
saluti
"tommik":
[quote="tokenring"]... Vi chiedo, è possibile avere un esempio di come si possa arrivare passo passo ad un valore di t pari a 1,984 con il 95% di confidenza (due code, scritto così nella tabella da cui riporto) e 100 gradi di libertà ?
Devi risolvere la seguente equazione:
$int_(-oo)^(t)(Gamma(101/2))/(10sqrt(pi)Gamma(100/2))[1+x^2/100]^(-(101)/2)dx=0.975$
saluti[/quote]
tommik grazie per la risposta, è quella al momento più comprensibile per uno come me, d'altro canto non riuscieri ancora a decifrare tutti i passaggi necessari ad arrivare al dunque. Immagino che Gamma sia una funzione o la funzione Beta che ho riscontrato in altri siti ? e come hai fatto ad impostare la funzione in questi termini ? se non chiedo troppo potresti svolgere tutti i passaggi per renderla comprensibile in termini matematici semplici (intendo per me) ? grazie, ciao
L'interesse nasce da un problema informatico che mi hanno sottoposto, l'approccio è di uno cha ha studi di ragioneria sulle spalle dove non si fa matematica dei licei e ci si ferma ai sistemi di equazione / disequazione, almeno questo è quello che era presente nel programma tanti anni fa. Non facevamo trigonometria e di lineari non se ne è vista neanche l'ombra. Adesso comprenderai il perchè la mia domanda è fallace. Comunque si, parlo della CDF della t di student, ma non sono in grado di completare tutti i passaggi partendo da due stupidi valori (n-1) e x% e non capisco perchè sia così difficile trovare in rete un esempio di come si possa svolgere il tutto. Se hai pazienza e vuoi e puoi darmi una via per comprendere meglio il procedimento ne sarò felice, grazie ancora
Il problema è di natura informatica e nasce da una specifica richiesta di un cliente, al momento ho bypassato proponendo di usare una tabella dei quantili precompilata, ma io sono testone e mi piace approfondire. So che dopo un certo numero di rilevazioni, t e Z (deviazione standard) sono equivalenti o forse (correggimi se sbaglio) i risultati di t convergono verso quelli di Z ma, ho letto che se la popolazione non è conosciuta va sempre utilizzato il calcolo degli intervalli di confidenza. In pratica la richiesta del cliente era: faccio campionature di conteggio pezzi, una bilancia rileva il peso l'operatore inputa il numero di pezzi il software ricalcola il peso medio, il peso medio viene storicizzato. Raccolti almeno 30 valori storicizzati del peso medio voglio calcolare una tolleranza accettabile intorno al valore medio. Ho spiegato al cliente che questa strada non porta da nessuna parte perchè il calcolo degli intervalli di confidenza serve solo a darci quanto probabile sia che un determinato valore medio rilevato più e più volte possa ricadere all'interno di un certo intervallo di valori ma tant'è che il cliente ha sempre ragione ho dovuto proseguire. Quando siamo arrivati al dunque ed ho proposto la t-student per rilevare un valore di tolleranza ricalcolato hanno detto che andava bene ma volevano agire sul parametro t impostando loro la percentuale di confidenza liberamente. al momento come dicevo prima, vista la difficoltà accertata nel calcolare t a run time ho proposto di utilizzare una tabella pre compilata. Ma a me piacerebbe comprendere come si arriva a calcolare il quantile t. chiaro è che se la cosa è troppo complessa, magari parto da più lontano e cerco di farmi un po' di ossa sull'argomento.
è un normalissimo intervallo di confidenza che avrai sicuramente risolto con le formule trovate in rete. In questi casi (controllo qualità) non si usano più i quantili della t di student ma semplicemente il $2sigma$ per una confidenza del 95% o $3sigma$ per una confidenza del 99% come puoi verificare tu stesso consultando argomenti come le "carte di controllo"
ovviamente i valori di $2sigma$ o $3sigma$ sono approssimazioni dei quantili "esatti" derivabili dalle formule statistiche.
Se il cliente vuole variare i livelli di confidenza liberissimo di farlo...non serve risolvere analiticamente quell'integrale...basta usare un calcolatore che lo calcoli per te....anche su Excel c'è già la formula bella e pronta...oltretutto approssimazione per approssimazione, dato che la distribuzione non è nota, puoi anche usare i quantili della Gaussiana, non cambia nulla
L'intervallo di confidenza, comunque, è proprio ciò che il cliente vuole, ovvero una stima intervallare del valore medio ottenuta con un livello di confidenza prefissato. In genere si usa 90 - 95 -99 % ma uno è libero di scegliersi l'intervallo che meglio gli aggrada. L'inica accortezza, dato che l'intervallo è bilaterale (a due code) per calcolare l'intervallo a livello 95% dovrai impostare la CDF a 97,5%, dato che si toglie 2.5% a destra e 2.5% a sinistra della distribuzione
Ora ti faccio io una domanda....ma se il cliente storicizza 30 pesate perché cercavi la soluzione con 100 gdl?
ovviamente i valori di $2sigma$ o $3sigma$ sono approssimazioni dei quantili "esatti" derivabili dalle formule statistiche.
Se il cliente vuole variare i livelli di confidenza liberissimo di farlo...non serve risolvere analiticamente quell'integrale...basta usare un calcolatore che lo calcoli per te....anche su Excel c'è già la formula bella e pronta...oltretutto approssimazione per approssimazione, dato che la distribuzione non è nota, puoi anche usare i quantili della Gaussiana, non cambia nulla
L'intervallo di confidenza, comunque, è proprio ciò che il cliente vuole, ovvero una stima intervallare del valore medio ottenuta con un livello di confidenza prefissato. In genere si usa 90 - 95 -99 % ma uno è libero di scegliersi l'intervallo che meglio gli aggrada. L'inica accortezza, dato che l'intervallo è bilaterale (a due code) per calcolare l'intervallo a livello 95% dovrai impostare la CDF a 97,5%, dato che si toglie 2.5% a destra e 2.5% a sinistra della distribuzione
Ora ti faccio io una domanda....ma se il cliente storicizza 30 pesate perché cercavi la soluzione con 100 gdl?
Si avendo dovuto approfondire l'argomento, ero fermamente convinto che bastasse applicare i calcoli della deviazione standaard, ma diciamo che al cliente non bastava. Conosco la presenza delle formule di excel e ho trovato anche dei calcolatori on line, da programmatore poi posso dirti che nel framework .Net ci sono librerie specifiche per la statistica introdotte di recente che possono adempiere a diverse funzioni, io ero solo curioso di capire come si potesse svolgere quel calcolo del quantile, è diciamo una mia sfida personale. Grazie comunque per il tempo che mi hai dedicato
"tokenring":
... io ero solo curioso di capire come si potesse svolgere quel calcolo del quantile, è diciamo una mia sfida personale. Grazie comunque per il tempo che mi hai dedicato
questo è tutto un altro problema....prova a postare l'integrale nella stanza di analisi e vedi cosa ti rispondono. Per le funzioni Gamma, essendo comunque multiple di $1/2$ si ricavano facilmente in modo ricorsivo
il problema è questo:
$int_(0)^(t)[1+x^2/n]^(-(n+1)/2)dx$
con n=100



hai fatto comunque tanto, grazie ancora.