Dubbi su test di bontà di adattamento
buonasera a tutti,
vi scrivo per chiedervi delucidazioni circa un dubbio che ho sui goodness of fit test; quel che so che ho letto e per quanto mi è stato possibile, studiato è che si tratta di prove per verificare quanto una serie di dati "fitta" una distribuzione supposta.
Esistono test parametri e non parametrici; tra i test non parametrici troviamo :
vi scrivo per chiedervi delucidazioni circa un dubbio che ho sui goodness of fit test; quel che so che ho letto e per quanto mi è stato possibile, studiato è che si tratta di prove per verificare quanto una serie di dati "fitta" una distribuzione supposta.
Esistono test parametri e non parametrici; tra i test non parametrici troviamo :
- Il test del chi quadro ( o del chi quadro di pearson)
il test di kolmogorov smirnov[/list:u:1m2lujv9]
A questo punto iniziano i dubbi..non tanto sulla scelta della distribuzione; sono quasi certo che si tratti di un esponenziale. Per vederlo ho costruito un istogramma di frequenza in excel.
I miei dubbi risiedono sul test in se e su come costruirlo in excel..io vedo che la curva teorica che ho tracciato si adatta direi anche molto bene ai dati sperimentali.però se calcolo il test del chi quadro con la formuletta
χ^2≅ ∑_(i=1)^k(O_i-E_i)^2/E_i
il test "non viene" nel senso che la somma di questi scarti è un valore troppo grande rispetto al valore limite calcolato con la funzione di excel
=INV.CHI.QUAD.DS(alpha ;gdl)
imposto correttamente, credo, i gradi di libertà considerando il numero delle classi e sottraendo da esse il numero dei parametri più uno.
upsilon = k - m - 1
Il calcolo delle frequenze attese è stato fatto utilizzando la CDF ( funzione di distribuzione) e considerando quindi la probabilità che il valore si trovi all'interno della classe. Moltiplicando per il numero dei valori ho calcolato la frequenza attesa..
Sapete, cortesemente, dirmi se secondo voi tralascio e/o sbaglio qualcosa?
PS: ho provato per capire e per vedere se trovavo ulteriori riscontri, a usare matlab per fare il test. Nelle info del test del chi quadro trovo scritto che il test serve a escludere o meno la normalità della variabile aleatoria analizzata, in altre parole se fallisce il test significa che la mia serie di dati non segue una distribuzione normale..A questo punto mi chiedo, ciò che ho letto in rete è sbagliato?o è stato da me male interpretato?
Mi scuso, mi rendo conto che la mia preparazione in materia è frammentaria e incompleta, ma il mio corso di laurea non prevede un corso di base di statistica e il tempo a mia disposizione è purtroppo risicato a tal punto da non permettermi di approfondire l'argomento come sarebbe opportuno.
Risposte
PS: approfitto per mettere un piccolo up e chiedere un consiglio su dei testi di statistica ( per l'ingegneria)
Statistica per ingegneria
di Douglas C. Montgomery, George C. Runger...
Probabilità e statistica per le scienze e l'ingegneria
di Pasquale Erto
da usare insieme al testo di Box e Hunter, in lingua inglese, che però posso solo consultare in uni..vi chiedo perchè vorrei acquisire una conoscenza teorica accettabile e sopratutto una "coscienza" applicativa
Secondo voi qual'è il migliore?
Statistica per ingegneria
di Douglas C. Montgomery, George C. Runger...
Probabilità e statistica per le scienze e l'ingegneria
di Pasquale Erto
da usare insieme al testo di Box e Hunter, in lingua inglese, che però posso solo consultare in uni..vi chiedo perchè vorrei acquisire una conoscenza teorica accettabile e sopratutto una "coscienza" applicativa

Secondo voi qual'è il migliore?