Esercizio su distribuzione di Student
Salve a tutti, riporto testo e svolgimento di un esercizio, vorrei sapere se il procedimento che utilizzo per la risoluzione è corretto:
Testo
"Una compagnia di assicurazioni vuole valutare l’entità media delle richieste di risarcimento danni per incidenti automobilistici. Un’indagine, svolta su di un campione di 25 richieste, fornisce i seguenti risultati (dove x rappresenta la variabile “richiesta di risarcimento in migliaia di euro”):$ sum^(25) x_i = 112.12 $ e $sum^(25) (x_i)^2 = 629.89$ . Ipotizzando che x abbia distribuzione gaussiana, calcolare l’intervallo di confidenza al 95% per la richiesta media di risarcimento, utilizzando la statistica di Student."
Svolgimento
Per calcolare l'intervallo di confidenza ci serve sapere gli estremi dell'intervallo $[bar(x) -k sigma_bar(x) , bar(x) - ksigma_bar(x) ]$tale che $P(bar(x) -k sigma_bar(x) < hat(x) < bar(x) -k sigma_bar(x)) = 0.95 $ dove $bar(x)$ è la media campionaria e $sigma_bar(x)$ è la deviazione standard della media della popolazione.
Otteniamo subito $bar(x) = (sum^(25) x_i)/25 = 4.48$
Essendo $sigma_bar(x)= sqrt( (sum^(N)(x_i - bar(x))^2/(N(N-1)))$ , giocando un po' con le sommatorie otteniamo dai dati:
$sigma_bar(x) = 0.5$
Dato che $ P(bar(x) -k sigma_bar(x) < hat(x) < bar(x) -k sigma_bar(x)) = P(abs(t) < k) $ dove $t := (hat(x) - bar(x))/sigma_bar(x)$, essendo $hat(x)$ il "valore vero" in cui è centrata la distribuzione ed essendo $nu = N -1 = 24$ il numero di gradi di libertà, dalle tabelle otteniamo che $k = 2.064$ da cui ricaviamo:
$bar(x) - k sigma_bar(x) = bar(x) - 2 sigma_bar(x) = 3.48$
$bar(x) + k sigma_bar(x) = bar(x) + 2 sigma_bar(x) = 5.48$
Per cui l'intervallo di confidenza al 95% è $[3.48 , 5.48]$
Grazie
EDIT:
Ho corretto alcune notazioni e aggiunto il numero di gradi di libertà su osservazione di tommik.
Testo
"Una compagnia di assicurazioni vuole valutare l’entità media delle richieste di risarcimento danni per incidenti automobilistici. Un’indagine, svolta su di un campione di 25 richieste, fornisce i seguenti risultati (dove x rappresenta la variabile “richiesta di risarcimento in migliaia di euro”):$ sum^(25) x_i = 112.12 $ e $sum^(25) (x_i)^2 = 629.89$ . Ipotizzando che x abbia distribuzione gaussiana, calcolare l’intervallo di confidenza al 95% per la richiesta media di risarcimento, utilizzando la statistica di Student."
Svolgimento
Per calcolare l'intervallo di confidenza ci serve sapere gli estremi dell'intervallo $[bar(x) -k sigma_bar(x) , bar(x) - ksigma_bar(x) ]$tale che $P(bar(x) -k sigma_bar(x) < hat(x) < bar(x) -k sigma_bar(x)) = 0.95 $ dove $bar(x)$ è la media campionaria e $sigma_bar(x)$ è la deviazione standard della media della popolazione.
Otteniamo subito $bar(x) = (sum^(25) x_i)/25 = 4.48$
Essendo $sigma_bar(x)= sqrt( (sum^(N)(x_i - bar(x))^2/(N(N-1)))$ , giocando un po' con le sommatorie otteniamo dai dati:
$sigma_bar(x) = 0.5$
Dato che $ P(bar(x) -k sigma_bar(x) < hat(x) < bar(x) -k sigma_bar(x)) = P(abs(t) < k) $ dove $t := (hat(x) - bar(x))/sigma_bar(x)$, essendo $hat(x)$ il "valore vero" in cui è centrata la distribuzione ed essendo $nu = N -1 = 24$ il numero di gradi di libertà, dalle tabelle otteniamo che $k = 2.064$ da cui ricaviamo:
$bar(x) - k sigma_bar(x) = bar(x) - 2 sigma_bar(x) = 3.48$
$bar(x) + k sigma_bar(x) = bar(x) + 2 sigma_bar(x) = 5.48$
Per cui l'intervallo di confidenza al 95% è $[3.48 , 5.48]$
Grazie

EDIT:
Ho corretto alcune notazioni e aggiunto il numero di gradi di libertà su osservazione di tommik.
Risposte
"singularity":
Dato che $ P(bar(x) -k sigma_bar(x) < bar(x) < bar(x) -k sigma_bar(x)) $
sì va tutto bene; non ho controllato i conti ma (se i dati della tabella sono riferiti ad una t di student con 24 gdl e al 97.5%) non ho dubbi che tu abbia fatto le cose per bene.
Devi correggere la formula che ti ho citato....e le seguenti di conseguenza....perché induce una certa ilarità.....questa è corretta....$mu$ è il parametro ignoto...cioè la media della popolazione sorgente.....
$ P(bar(x) -k sigma_bar(x) < mu < bar(x) -k sigma_bar(x)) $
anche quella della t è proprio brutta...oltre che sbagliata....per scriverla correttamente al numeratore dovresti mettere $bar(x)-mu$ dove $bar(x)$ è la media del campione mentre $mu$ è la media della media del campione, pari alla media della popolazione
"singularity":
$t := (x - bar(x))/sigma_bar(x)$
Se ti interessa QUI trovi la forma corretta della distribuzione t e da dove esce
ciao
Ok grazie dell'aiuto. Ho corretto il messaggio iniziale per non creare confusione a chi legge.