Media campionaria quesito semplice (per voi)

pamflona
Salve a tutti..
vorrei chiedere il vostro aiuto su un quesito ritengo semplice per voi!

Dunque ho una popolazione di circa 17.000 famiglie e devo fare un campionamento per ottenere una stima statisticamente significativa di una variabile (che nello specifico riguarda la produzione pro-capite di rifiuti). Non ho altre informazioni. Di quante famiglie dovrebbe comporsi il campione?

Grazie mille a tutti quelli che vorranno aiutarmi

Ciao
P.

Risposte
Rggb1
Quanto significativa, come minimo? Perché, per dirla un po' terra-terra, se il tuo minimo non ha importanza, e calcoli dopo quanto lo sia, il campione può essere anche una famiglia sola :-D

Ma più realisticamente vorrai una stima puntuale un po' più affidabile (spero); ed inoltre ti servirebbe il dato pro capite mentre il tuo campione è di famiglie, ho capito bene?

pamflona
Si .. direi che hai capito benissimo... mi serve il dato pro-capite ma per questo pensavo di dividere la produzione registrata per famiglia del campione per il numero di componenti.

Per quanto riguarda la significatività, ovviamente abbastanza significativa, penso che il 95% dei casi possa andar bene.. ma ovviante essendo molto profano in materia accetto tutti i consigli e le critiche del caso e chido scusa se ho detto stupidagini

Grazie comunque per il tuo aiuto
P.

itpareid
secondo me la scelta del campione non è così facile né per te, né per noi, né per l'istat.
ma ti serve per lavoro o per puro esercizio?

pamflona
Si tratta di un piccolo lavoro non di natura statistica, in cui l'alternativa "statistica" è un termine di paragone

Su internet ho trovato dei tool che attestano il campione intorno alle 380 unità e volevo capire se fosse attendibile o meno

Ciao

P.

cenzo1
Ciao, sottopongo alcune riflessioni, se possono esserti utili.

Se ho ben capito la numerosità del campione è relativa alla stima del valore medio di una certa variabile, quindi avresti bisogno, oltre del livello di confidenza (ipotizziamo 95%), anche di una stima della varianza del carattere nella popolazione e dell'errore assoluto tollerato.
Come intendi fissare questi ultimi due dati, in particolare la varianza della popolazione ?

Nei tool che hai trovato su internet, che valori hai usato ?

In genere per stimare questi dati si potrebbe fare una indagine pilota, oppure utilizzare informazioni proveninenti da studi simili.

Un'altra domanda. Qual è la finalità della tua indagine ?
Se l'obiettivo è solo di ottenere una produzione media di rifiuti, che so, per il dimensionamento di un certo servizio, non si potrebbero utilizzare le produzioni medie risultanti da indagini che puoi reperire facilmente in rete relative ad altri comuni ?

Oppure, se già esiste un servizio di raccolta rifiuti, non si potrebbero richiedere i dati di raccolta annuali/giornalieri al consorzio e poi dividerli per la popolazione, in modo da avere la produzione pro-capite ?

pamflona
Ciao, nel tool che ho trovato su internet .. che poi è questo http://www.opinioni.net/campione.php ho utilizzato come intervallo di confidenza il valore di 5 % (se ho capito bene è l'errore che sono disposto a tollerare sul valore che otterrò .. ossia che nel 95% dei casi il valore vero della media della popolazione ricade in un intorno di +- 5% della media campionaria ... questa ipotesi mi sembrava abbastanza adeguata in termini di precisione.

Purtroppo non posso fare una indagine pilota perchè come ti dicevo mi serve a scopo comparativo, proprio rispetto all'uso di altre metodologie come appunto quella di prendere informazioni assimilabili derivanti da contesti simili.

Grazie mille

P.

cenzo1
La formula per calcolare la numerosità del campione utilizzata nel link che hai indicato è valida solo per stimare una proporzione (ad esempio la percentuale di soggetti che hanno una certa caratteristica), non una media (quella che serve a te), pertanto non la puoi utilizzare nel tuo caso.
La formula sarebbe questa:
$n=(N*1.96^2/D^2\hat{p}(1-\hat{p}))/(N+1.96^2/D^2\hat{p}(1-\hat{p}))$ dove:
$\hat{p}$ è una stima iniziale della proporzione (se non sai che pesci prendere si assume di solito il caso peggiore $\hat{p}=0.5$ [in quanto da' luogo alla massima varianza nella popolazione]);
$N$ è la numerosità della popolazione (nel tuo caso 17000);
$1.96$ il quantile della normale standard per un livello di confidenza 95% (al 99% usa invece $2.576$)
$D$ è l'errore massimo che sei disposto a tollerare (quello che hai messo uguale al 5%, ovvero un errore assoluto di 0.05 rispetto alla proporzione da stimare)

Con i tuoi dati risulta $n=(17000*1.96^2/0.05^2*0.5(1-0.5))/(17000+1.96^2/0.05^2\0.5(1-0.5))=375.6$

Però, ti ripeto, nel tuo caso questa formula non è adatta, in quanto non devi fare una stima di una percentuale (che ne so, di quelli che voterebbero un certo candidato), ma di una media (della produzione di rifiuti).

Andrebbe usata un'altra formula, in cui ti occorre sapere:
- una stima della varianza del carattere (produzione di rifiuti) nella popolazione (vedi il mio intervento precedente)
- e in cui fissi l'errore massimo assoluto che sei disposto a tollerare sulla stima (ad esempio 20 kg di rifiuto pro-capite annui)

pamflona
Uao!!! solo per curiosità a questo punto .. quale sarebbe la formula corretta da usare? Stima della varianza ed errore massimo possono esprimersi sempre in valori percentuali o è necessario indicare il valore assoluto?

Grazie

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.