Sulla scelta di campioni

plague_spreader
Salve a tutti!

Mi sto approcciando solo ora alla statistica (me ne vergogno) e mi era sorto un dubbio: io so che per fare degli esperimenti su dei dati reali sarebbe opportuno scegliere un sottoinsieme di questi dati (che si suppone essere enorme) in maniera tale che ogni campione risulti essere rappresentativo della popolazione, ovvero si scelgono gli elementi del campione in maniera casuale. Ora, se io volessi avere più di un campione sul quale effettuo diversi esperimenti (che sono comunque correlati, come ad esempio il comportamento di sistemi sotto uno stesso stimolo ma in ambienti diversi), avrei anche bisogno che tali campioni siano ANCHE di uguale grandezza (per lo meno in misura approssimativa) poiché statistiche descrittive come media e varianza (campionaria, ovviamente) hanno maggior senso solo su insiemi con quanto più simile cardinalità.

Qual è la scelta migliore che posso fare per avere rappresentatività e ugual cardinalità dei campioni (estendendosi anche a più di due campioni)? Partizionare un campione grande in più insiemi va bene oppure è meglio prendere elementi a caso e assegnarli ad una partizione a caso finché non ottengo degli insiemi di uguale cardinalità (con la consapevolezza di poter arrivare ad avere tutti gli elementi in una sola partizione, teoricamente)?

Risposte
plague_spreader
Bump.

dasalv12
Personalmente ti consiglierei di prendere in mano un qualsiasi libro di teoria dei campioni o una dispensa oltre che un manualino di statistica di base. La scelta del piano di campionamento è essenziale e va ad influenzare le procedure successive oltre e la bontà dei risultati. Questa scelta dipende da molti fattori connessi alla natura dell'esperimento in questione, per questo è meglio approfondire prima la teoria, se sbagli il pdc il resto è da buttare.

plague_spreader
Io non lo sapevo nemmeno esistesse una teoria apposta per scegliere dei campioni, ti ringrazio moltissimo!

Comunque leggendo il libro "Probabilità e statistica per l'ingegneria e le scienze" di Sheldon M. Ross a pagina 167 ci sta un esempio che spiega proprio come scegliere dei sottoinsiemi di cardinalità $k$ a partire da un insieme di $n$ elementi utilizzando le distribuzioni uniformi e lo si può fare in questo modo (riporto la metodologia (immagino sia una cosa che si possa fare, in caso contrario pardon) così chiunque può utilizzarla senza cercare ulteriormente):

si definisce un numero $k-1$ di variabili aleatorie uniformi ($1 \lt k \lt n$ ovviamente) ed un equivalente numero di funzioni indicatrici che indicano (scusate il gioco di parole) se il $j$-esimo elemento degli $n$ finirà nel nostro sottoinsieme di $k$ elementi. Abbiamo quindi:

\( I_{j+1} = \begin{cases} 1 & \mbox{se } U_{j+1} < \frac{k-\sum_{i=1}^{j} I_{j} }{n-j} \\ 0 & \mbox{altrimenti} \end{cases}, \, 1 \lt j \lt n \)

facendo variare $j$ (nell'ordine) fra $0$ e $n-1$ e terminando una volta che $\sum_{j=0}^{n-1} I_{j+1} = k$.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.