[EX] Test del chi-quadro e livello di confidenza
La distribuzione dei numeri prodotti da un generatore di numeri casuale è la seguente -sia il x il numero casuale e il valore dopo i due-punti la frequenza con cui si osserva un valore casuale nell'intervallo riportato sulla sinistra:
$0.0 <= x < 0.1 : 12$
$0.1 <= x < 0.2 : 12$
$0.2 <= x < 0.3 : 9$
$0.3 <= x < 0.4 : 13$
$0.4 <= x < 0.5 : 7$
$0.5 <= x < 0.6 : 9$
$0.6 <= x < 0.7 : 5$
$0.7 <= x < 0.8 : 12$
$0.8 <= x < 0.9 : 9$
$0.9 <= x < 1.0 : 12$
Usare il test del chi-quadro per stabilire se i dati osservati sono compatibili a un livello di confidenza del 95% con la distribuzione uniforme nell'intervallo $(0,1)$.
Tentativo di svolgimento:
distribuzione costante in $(0,1)$, i.e. se la quantità di numeri generati casualmente è $100$ (sommo le occorrenza di ciascun range di valori), per ogni intervallo la frequenza attesa sarà $10$ -ogni intervallo è largo allo stesso modo.
Calcolo del chi-quadro, da manuale:
$\chi^2 = \sum_(k = 1)^10 (O_k - E_k)^2 / E_k \approx 6.201$
Chi-quadro ridotto? Numero di gradi di libertà: il numero di dati elaborati meno il numero di vincoli:
$d := n - c$
Nel nostro caso il vincolo è solo uno, ed è il numero totale dei numeri generati casualmente (100) -che ho usato per calcolare il valore atteso di occorrenze per ciascun intervallo.
Quindi:
${"chi-quadro ridotto"} : = \chi^2 / d = \chi^2 / 9 \approx 0.689$
Ora: so* che la probabilità di ottenere un valore di chi-quadrato maggiore o uguale a $0.689$, a parità di gradi di libertà, in una campagna di misure qualsiasi, è di circa il 70%.
L'accordo è buono, direi. Ma quanto? Cioé (se proprio devo dirlo) a quale livello di confidenza?

____
*Sto usando una tabella (l'Appendice D di Introduzione all'analisi degli errori di Taylor)