Bin istogramma
Salve stavo studiando dal libro di laboratorio 1 il capitolo sulla rappresentazione dei dati. Mi dice che se voglio rappresentare un istogramma delle occorrenze di un certo evento che può avere più esiti esiste una formula empirica che da le dimensioni consigliate dei bin da prendere ed è: $ (x_max-x_min)/sqrtN $ . Qualcuno potrebbe darmi una spiegazione migliore del perchè sia consigliabile prendere questo come dimensione dei bin?
Risposte
In generale quando hai un campione e devi creare una partizione a parte casi particolari di dati addensati in alcuni intervalli specifici si definisce una partizione eguale del range del campione. Quindi:
$ (R(X))/k=((MAX(x_i)|_[i=1,..,n]) - (MIN(x_i)|_[i=1,..,n]))/k $ .
Per quanto riguarda il fattore $ sqrt(N) $ è un regola empirica che afferma di essere un buon metodo per partizionare il campione , quindi non c'è una vera e propria spiegazione . A quanto ne so non c'è un vero e proprio metodo per definire delle partizioni ottimali per creare un'istogramma. Ci sono alcuni accorgimenti empirici dati per buoni(come questo) oppure in base alle abilità di chi analizza i dati.
$ (R(X))/k=((MAX(x_i)|_[i=1,..,n]) - (MIN(x_i)|_[i=1,..,n]))/k $ .
Per quanto riguarda il fattore $ sqrt(N) $ è un regola empirica che afferma di essere un buon metodo per partizionare il campione , quindi non c'è una vera e propria spiegazione . A quanto ne so non c'è un vero e proprio metodo per definire delle partizioni ottimali per creare un'istogramma. Ci sono alcuni accorgimenti empirici dati per buoni(come questo) oppure in base alle abilità di chi analizza i dati.