Test $chi^2$ di Goodness of Fit
Ciao ragazzi, non riesco a capire una cosa... nell'esercizio 3 del file che vi ho allegato è presente una cosa che non capisco.
nelle soluzioni perché il valore $n$ che dovrebbe rappresentare il numero di elementi da cui è costituito il sistema è 7,48?
come ci è arrivato, non dovrebbe essere $n=10$?
nelle soluzioni perché il valore $n$ che dovrebbe rappresentare il numero di elementi da cui è costituito il sistema è 7,48?
come ci è arrivato, non dovrebbe essere $n=10$?
Risposte
no, come 10???
Devi stimare i parametri della distribuzione teorica basandoti sulle risultanze osservate...
${{: ( np=1.600 ),( np(1-p)=1.2580 ) :}rarr{{: ( n=7.48 ),( p=0.21 ) :}$
PS: nel foglio excel ha scritto $np(1-p)=1.1216$ ma ovviamente intende $sqrt(np(1-p))=1.1216$ infatti lo chiama "sigma"...ma è evidente cosa intenda....così come dovrebbe essere chiaro come ha calcolato media e varianza campionarie.
ciao
Devi stimare i parametri della distribuzione teorica basandoti sulle risultanze osservate...
${{: ( np=1.600 ),( np(1-p)=1.2580 ) :}rarr{{: ( n=7.48 ),( p=0.21 ) :}$
PS: nel foglio excel ha scritto $np(1-p)=1.1216$ ma ovviamente intende $sqrt(np(1-p))=1.1216$ infatti lo chiama "sigma"...ma è evidente cosa intenda....così come dovrebbe essere chiaro come ha calcolato media e varianza campionarie.
ciao
${{: ( np=1.600 ),( np(1-p)=1.2580 ) :}$
quindi questi erano i dati del problema? e io dovevo ricavare da quello tutto? se è così è facile... pensavo che quei dati fossero stati ricavati in un qualche modo.
un ultima cosa, nelle soluzioni del primo esercizio è presente questo dato $$, cosa dovrebbe rappresentare?
quindi questi erano i dati del problema? e io dovevo ricavare da quello tutto? se è così è facile... pensavo che quei dati fossero stati ricavati in un qualche modo.
un ultima cosa, nelle soluzioni del primo esercizio è presente questo dato $
no questi sono i risultati...li devi calcolare tu dai dati della tabella.
non ho ben capito...
io devo trovare n, p dai dati della tabella che mi da l'esercizio?
io devo trovare n, p dai dati della tabella che mi da l'esercizio?
in una binomiale la media è data da $mu=np$ mentre la varianza è data da $sigma^2=np(1-p)$
I test in oggetto è un test chi-quadro di Goodness of Fit con distribuzione non completamente specificata; in altre parole ipotizzi una certa distribuzione ma con parametri non noti. A questo punto, essendo parametri non noti, li si stima (cioè li si approssima) con i dati campionari. Per ragioni che dovresti conoscere,
La media si stima con la media del campione
La varianza con la varianza campionaria....
Calcolando media e varianza campionaria dai dati in tabella ottieni quelli che ti ho scritto....
$bar(X)=1.600000$
$S^2~~ 1.257971~~ 1.2580$
per la simbologia di chiedi al prof. non è un simbolo univoco...oppure guarda la soluzione e dovresti capirlo
I test in oggetto è un test chi-quadro di Goodness of Fit con distribuzione non completamente specificata; in altre parole ipotizzi una certa distribuzione ma con parametri non noti. A questo punto, essendo parametri non noti, li si stima (cioè li si approssima) con i dati campionari. Per ragioni che dovresti conoscere,
La media si stima con la media del campione
La varianza con la varianza campionaria....
Calcolando media e varianza campionaria dai dati in tabella ottieni quelli che ti ho scritto....
$bar(X)=1.600000$
$S^2~~ 1.257971~~ 1.2580$
per la simbologia di
ok, forse ho capito... provo a fare tutti i conti
rieccomi, ho fatto tutti i calcoli e ho capito dove sbagliavo... ma ora mi sorge una domanda, perché il mio docente ha deciso di togliere le frequenze per le classi 5-6-7-8-9-10?
se sono troppo piccole il chi quadro sarebbe troppo sballato?
esattamente che succede se non le tolgo?
se sono troppo piccole il chi quadro sarebbe troppo sballato?
esattamente che succede se non le tolgo?
Affinché il chi-quadro sia preciso, serve che ogni elemento abbia almeno 5 osservazioni. Per cui le osservazioni marginali o le accorpi a quella precedente oppure, come ha giustamente fatto il docente, le elimini...tanto sono talmente piccole rispetto alle altre che non spostano nulla...
Devi considerare che stai facendo un test.. Non c'è un "giusto " o uno "sbagliato ". Tutto è consentito purché teoricamente consistente.
Devi considerare che stai facendo un test.. Non c'è un "giusto " o uno "sbagliato ". Tutto è consentito purché teoricamente consistente.
quindi se io le tengo non cambia più di tanto? giusto? si tolgono solo per rendere più "pulito" il tutto.
grazie mille tommik, sei stato gentilissimo.
grazie mille tommik, sei stato gentilissimo.
No. Se le tieni le devi accorpare . Se fai il test con le frequenze <5 il test si sballa
Dovresti fare, ad esempio $O(X>=4)=8$
Poi per calcolare media e varianza invece di 4 dovresti prendere, ad Es, 4.5 ecc ecc...complicando inutilmente le cose senza avere alcun vantaggio. È più naturale e corretto considerare quei valori come "anomali"
Dovresti fare, ad esempio $O(X>=4)=8$
Poi per calcolare media e varianza invece di 4 dovresti prendere, ad Es, 4.5 ecc ecc...complicando inutilmente le cose senza avere alcun vantaggio. È più naturale e corretto considerare quei valori come "anomali"
ah ok ok, infatti avevo provato a farlo con quelle frequenze e veniva un po' strano.
ora ho capito perfettamente, grazie mille
ora ho capito perfettamente, grazie mille
