[Statistica] Scelta media

hamming_burst
Salve,
vorrei avere un vostro parere su quale possa essere la giusta scelta di che media utilizzare.

Ho due serie di dati:

    [*:3cue4ift] un campione di numerosità $60$ (il tipo di popolazione di origine è ancora in fase di studio), valori di intervallo $(0,30)$ (non esiste lo $0$ per approssimazione di calcolo numerico).
    [/*:m:3cue4ift]
    [*:3cue4ift] un insieme di $10000$ campioni di cui sopra[/*:m:3cue4ift][/list:u:3cue4ift]


    devo creare una funzione di minimazzazione, che mi restituisca il campione ottimo. L'idea è utilizzare le basi dell'analisi media-varianza (solo l'idea superficiale non introduco ottimo paretiano e compagnia)

    Già utilizzando media aritmetica e varianza campionaria, con una funzione che minimizza tali dati ho trovato un buon risultato. Ma sono a conoscenza di altri tipi di medie statistiche che forse potrebbero darmi altre considerazioni.

    Spulciando in rete ho trovato la
    La media quadratica si applica quando si deve eliminare l’influenza dei segni e quando si deve evidenziare l’esistenza nella distribuzione di valori molto grandi o molto piccoli.


    La mia domanda: se io volessi evidenziare nel campione di 60 i valori minimi, la media quadratica forse è migliore della media aritmetica che equidistribuisce il tutto?

    Ringrazio chi darà un parere :-)

Risposte
hamming_burst
Ciao Sergiom
"Sergio":
Non so proprio se posso esserti utile, ma mi piacerebbe capire una cosa: che vuol dire "campione ottimo"?

forse è abuso di linguaggio, ma intendo il campione migliore che ha media e varianza minimi.

$n=60, m=10000$

$X_1 = {x_{1,1},x_{1,2},...,x_{1,n}} $
...
$X_m = {x_{m,1},x_{m,2},...,x_{m,n}}$

calcolo media e varianza campionaria di ogni campione $X_1,...,X_m$ (tralascia la notazione...)
$E[X_1],...,E[X_m]$
$Var(X_1),...,Var(X_m)$

io cerco il campine ottimo che è soluzione del problema bi-obiettivo $\min{}$ con $i=1,...,m$
in pratica la miglior soluzione che minimizza il problema.

Ma a parte questo, quello che mi preme capire è quando utilizzare una media piuttosto che un'altra.

hamming_burst
"Sergio":
Sì, ma quello che non capisco è perché sarebbe ottimo un campione con media e varianza minime.
Ad esempio, se la media "vera" della popolazione fosse 15, perché tra le tre medie campionarie 1, 15, 29 la prima dovrebbe essere ottima?

sì hai ben ragione a porre questa domanda, ma per il momento non guardo il legame con la popolazione, ma solo come risolvere il problema di ottimizzazione. anche se ciò che hai posto è un punto che devo studiare.


Quanto agli usi delle diverse medie, la media quadratica "evidenzia" non solo i valori minimi, ma anche quelli massimi. In concreto, se hai \(\mathbf{x}=(1,2,3,4,5,6,7,8,9)\) e \(\mathbf{y}=(5,5,5,5,5,5,5,5,5)\), le medie aritmetica sono uguali, quella quadratica di \(\mathbf{x}\) è maggiore di quella di \(\mathbf{y}\). Un'indicazione di maggior dispersione che ti dà anche la varianza.

Ok perciò la media quadratica dà le stesse informazioni che potrei trovare studiando l'andamento della media aritmetica assieme alla varianza, giusto?

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.