Usare la Media di medie o altro?

ReggaetonDj
Ciao, mi viene un dubbio circa l'utilizzo della media.

Supponiamo di avere una popolazione di numerosità variabile nel tempo, e di poterne osservare una proprietà quantitativa (ad esempio l'altezza) [tex]$x$[/tex] con cadenza temporale fissa. Per ogni osservazione posso calcolare la media delle altezze osservate. Se al tempo [tex]$t$[/tex] ho un insieme di individui (una popolazione) [tex]$N_t$[/tex], posso calcolarla così:

[tex]$\bar{x}_t=\frac{1}{|N_t|}\sum_{i \in N_t} x_i$[/tex]

Se io avessi un insieme di $m$ osservazioni temporali [tex]$O = \{\bar{x}_1, \dots, \bar{x}_m \}$[/tex] ed avessi bisogno di un indicatore di sintesi, avrei due strade possibili.

1) La media delle medie. (che mi pare si chiami "Grande media")

La cosa più semplice da fare è quella di calcolare la media delle medie, ovvero:

[tex]$\bar{\bar{x}}=\frac{1}{|O|}\sum_{i \in O} \bar{x}_i$[/tex]


2) La somma di tutte le osservazioni divisa per tutte le numerosità

Mi spiego meglio. Potrei calcolare il rapporto tra tutte le altezze viste in tutte le $m$ osservazioni e la somma delle numerosità di tutte le sessioni di misura. In formule:

[tex]$y=\frac{\sum_{i \in N_1} x_i + \sum_{i \in N_2} x_i + \dots + \sum_{i \in N_m}x_i } {|N_1| + |N_2| + \dots + |N_m|}$[/tex]


Se le numerosità delle popolazione fosse costante, i due metodi sarebbero identici. Ma quando non lo sono, quale è meglio usare? Che informazioni differenti mi danno [tex]$\bar{\bar{x}}$[/tex] ed [tex]$y$[/tex]?

Grazie, Ciao.

Risposte
ReggaetonDj
Ops, ho fatto una domanda banale? :oops:

DajeForte
"ReggaetonDj":
Ops, ho fatto una domanda banale? :oops:


Per me non tanto e infatti la mia risposta è: dipende.

Ovvero io vedrei quali sono le tue finalità.

Considera il tuo esempio: nel primo caso fai la media semplice delle altezze medie.
Quindi come dire ho m osservazioni, ciascuna è la media delle altezze dei ragazzi della terza elementare nei vari anni.
Se ne fai la media semplice vedi quale è la media della classe nei vari anni.

Se invece fai la seconda calcoli l'altezza media di tutti i ragazzi che nei vari anni sono passati per la terza media;
è come se accorpassi tutti i ragazzi in una unica distribuzione e ne fai la media.
Quindi così ottieni una media dei ragazzi.

A questo punto la scelta direi dipenda dallo scopo del tuo studio e da atltri fattori (come ad esempio sono distribuiti i pesi $N_i$; se ad esempio fossero tutti uguali le due medie coincidono).

Inoltre terrei presente i problemi che possono sorgere (legati poi alla finalità del tuo studio).
Se ad esempio hai una classe poco numerosa ma con alunni molto anni la media 1) ne risente di più la media 2) ovviamente meno.

ReggaetonDj
Ciao! Grazie per la risposta.

A questo punto forse credo che sarebbe utile fare una semplice media pesata...

cenzo1
"ReggaetonDj":
A questo punto forse credo che sarebbe utile fare una semplice media pesata...

Quindi hai deciso di applicare la 2) :wink:

ReggaetonDj
"cenzo":
[quote="ReggaetonDj"]A questo punto forse credo che sarebbe utile fare una semplice media pesata...

Quindi hai deciso di applicare la 2) :wink:[/quote]

Esatamente, di fatto il mio quesito era: differenza tra media aritmetica semplice e media pesata :oops:

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.