Test $chi^2$ di Goodness of Fit

Ragazzo1231
Ciao ragazzi, non riesco a capire una cosa... nell'esercizio 3 del file che vi ho allegato è presente una cosa che non capisco.
nelle soluzioni perché il valore $n$ che dovrebbe rappresentare il numero di elementi da cui è costituito il sistema è 7,48?
come ci è arrivato, non dovrebbe essere $n=10$?

Risposte
Lo_zio_Tom
no, come 10???

Devi stimare i parametri della distribuzione teorica basandoti sulle risultanze osservate...

${{: ( np=1.600 ),( np(1-p)=1.2580 ) :}rarr{{: ( n=7.48 ),( p=0.21 ) :}$

PS: nel foglio excel ha scritto $np(1-p)=1.1216$ ma ovviamente intende $sqrt(np(1-p))=1.1216$ infatti lo chiama "sigma"...ma è evidente cosa intenda....così come dovrebbe essere chiaro come ha calcolato media e varianza campionarie.


ciao

Ragazzo1231
${{: ( np=1.600 ),( np(1-p)=1.2580 ) :}$

quindi questi erano i dati del problema? e io dovevo ricavare da quello tutto? se è così è facile... pensavo che quei dati fossero stati ricavati in un qualche modo.


un ultima cosa, nelle soluzioni del primo esercizio è presente questo dato $$, cosa dovrebbe rappresentare?

Lo_zio_Tom
no questi sono i risultati...li devi calcolare tu dai dati della tabella.

Ragazzo1231
non ho ben capito...
io devo trovare n, p dai dati della tabella che mi da l'esercizio?

Lo_zio_Tom
in una binomiale la media è data da $mu=np$ mentre la varianza è data da $sigma^2=np(1-p)$

I test in oggetto è un test chi-quadro di Goodness of Fit con distribuzione non completamente specificata; in altre parole ipotizzi una certa distribuzione ma con parametri non noti. A questo punto, essendo parametri non noti, li si stima (cioè li si approssima) con i dati campionari. Per ragioni che dovresti conoscere,

La media si stima con la media del campione

La varianza con la varianza campionaria....

Calcolando media e varianza campionaria dai dati in tabella ottieni quelli che ti ho scritto....

$bar(X)=1.600000$

$S^2~~ 1.257971~~ 1.2580$

per la simbologia di chiedi al prof. non è un simbolo univoco...oppure guarda la soluzione e dovresti capirlo

Ragazzo1231
ok, forse ho capito... provo a fare tutti i conti

Ragazzo1231
rieccomi, ho fatto tutti i calcoli e ho capito dove sbagliavo... ma ora mi sorge una domanda, perché il mio docente ha deciso di togliere le frequenze per le classi 5-6-7-8-9-10?
se sono troppo piccole il chi quadro sarebbe troppo sballato?
esattamente che succede se non le tolgo?

Lo_zio_Tom
Affinché il chi-quadro sia preciso, serve che ogni elemento abbia almeno 5 osservazioni. Per cui le osservazioni marginali o le accorpi a quella precedente oppure, come ha giustamente fatto il docente, le elimini...tanto sono talmente piccole rispetto alle altre che non spostano nulla...

Devi considerare che stai facendo un test.. Non c'è un "giusto " o uno "sbagliato ". Tutto è consentito purché teoricamente consistente.

Ragazzo1231
quindi se io le tengo non cambia più di tanto? giusto? si tolgono solo per rendere più "pulito" il tutto.
grazie mille tommik, sei stato gentilissimo.

Lo_zio_Tom
No. Se le tieni le devi accorpare . Se fai il test con le frequenze <5 il test si sballa

Dovresti fare, ad esempio $O(X>=4)=8$

Poi per calcolare media e varianza invece di 4 dovresti prendere, ad Es, 4.5 ecc ecc...complicando inutilmente le cose senza avere alcun vantaggio. È più naturale e corretto considerare quei valori come "anomali"

Ragazzo1231
ah ok ok, infatti avevo provato a farlo con quelle frequenze e veniva un po' strano.
ora ho capito perfettamente, grazie mille :D

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.