Le Media e la scelta giusta

clive999
Ciao,
devo calcolare il paniero medio di alcuni utenti a seconda del Paese.

Le spese sono molto diverse tra utente e utente (alcuni 25 euro, altri 5 000).
La media aritmetica quindi non mi serve perchè influenzabile dai valori troppo piccoli.

Quale sarà la media che più mi consigliate per scoprire il valore medio in euro di ogni cliente?

Grazie

Risposte
nino_12
Per definire il potere d'acquisto e i beni acquistabili da una moneta si usa la media armonica.
Per analizzare la variazione dei prezzi nel tempo si usa la media geometrica.

clive999
Ciao Nino, grazie per la risposta.

Io ho pero' un problema forse diverso.
Eccoti l'esempio:

10 000 clienti o acquisti
Non si conosce l'unicità del cliente (non esiste carte fidelità per riconoscere se è lo stesso cliente)=> quindi cliente o acquisto sono la stessa cosa
Spesa totale 2 000 000 euro su un periodo 6 mesi
Ogni cliente puo' effettuare più acquisti (minimo 20 euro).


Che media calcoleresti?
Perchè l'aritmetica darebbe 200 euro (spesa totale/numero acquisti) ma sarebbe "stupido" valorizzare ogni cliente 200 euro per ovvie ragioni ...chi ne spende 20, chi 300, chi 1 000, ecc
In più so dai discorsi di alcune cassiere che a volte c'è chi spende 5 000 euro su più acquisti (riconoscono il cliente visivamente) e chi ne spende solo 20 e niente di più. La variazione è enorme tra i clienti

nino_12
Non ho idea.
La media geometrica e ancor più quella armonica sono influenzati fortemente dai valori piccoli e quindi mi pare non ti vadano bene.
Forse, nel tuo caso potresti fare la media aritmetica ponderata, moltiplicando ogni valore per un coefficiente che ne definisce l'importanza e dividendo per la somma dei pesi.
Però dovresti conoscere la distribuzione di probabilità e la varianza.

clive999
Cosa intendi con conoscere la distribuzione di probabilità e la varianza?
Nel mio esempio come le inseriresti anche inventando i numeri?

vict85
Immagino che il valore che ti interessa è la mediana e non la media. Ma potrebbe interessarti anche la moda. Io sinceramente ti consiglio di considerarli tutti e tre.

P.S.: Il modo in cui calcoli la media dipende dalla natura dei dati che prendi in considerazione e non da quello che ritieni convenga. Non esistono davvero più medie, ne esiste solo una, ma come la calcoli dipende dai dati.

clive999
Grazie vict85...
pero' nel mio caso come fareste?
Non so che pesci pigliare per analizzare la cosa.

Anche perchè ho una media aritmetica di 130 euro, una media armonica di 60 euro e una deviazione 232...che vuol dire,penso, che la spesa varia tantissimo da cliente a cliente...

vict85
Dimenticati la media armonica. Quali sono mediana e moda?

nino_12
Si tratta di una distribuzione asimmetrica; questo tipo di andamento della probabilità di una variabile è tipico di molti fenomeni statistici con valori estremi a probabilità bassa, o addirittura non apprezzabili (es. l'intensità dei terremoti in una zona, i consumi alimentari di una popolazione e, ricordo nella mia attività lavorativa, la concentrazione di molti radioisotopi nell'ambiente, ecc...

E' utile in questo caso avere la frequenza cumulativa, che per una distribuzione normale è rappresentata da una retta.
Qualcuno qui potrebbe forse aiutarti più di me, ci sono carte grafiche apposite.
Dato il campione di n misure, queste si dispongono in ordine crescente, associando ad ogni valore la sua frequenza cumulativa $ P(i) = i/(n+1) * 100 $
Se i punti non stanno su una retta, caso di distribuzione asimmetrica, si può utilizzare il logaritmo della variabile (ci sono in commercio grafici con scala logaritmica).
In questo caso, i punti della frequenza cumulativa dovrebbero essere molto più allineati.
La distribuzione log-normale corrisponde ad una gaussiana sbilenca e si raddrizza applicando il logaritmo.
L'ascissa della curva di frequenza cumulativa % è quindi logaritmica.

La distribuzione log-normale corrisponde a quei casi in cui si hanno valori estremi in una direzione.
In questi casi, più che la media è utile conoscere la mediana, che corrisponde al 50% di frequenza cumulativa.

Guarda con google, probabilmente ci sono link come questo:
http://www.regione.sicilia.it/presidenz ... tica_3.pdf
che potrebbero interessarti

vict85
Sinceramente non vedo alcuna ragione né nel problema, né nei dati per usare una media diversa da quella aritmetica e di applicare, a caso, metodi più complessi.

Trovo senz'altro utile invece tenere conto di mediana e quartili per capire meglio la distribuzione. Se il problema è che ci sono clienti che fanno poche spese grandi e altri che spendono poco ma spesso e i tuoi dati non sono in grado di catturare questo aspetto; allora il tuo problema è che i tuoi dati non sono adatti per quello che vuoi fare e non ci sono metodi statistici per migliorare questo aspetto.

clive999
Vict85, eccoti i calcoli su un campione che abbia speso almeno 20 euro nel supermercato in cui lavoro:

Media aritmetica 200 €
Media Armonica 50 €
Media Geometrica 100 €
Mediana 70 €
Moda 25 €
Deviazione 700 σ

Che cosa ne deducete? :)

vict85
Che la maggior parte delle spese sono piccole. Ma sulle persone non dice nulla. Il tuo problema è che non possiedi i dati che ti servono, insomma che non sai come associare le spese ad una persona specifica. E la statistica non può aiutarti.

clive999
si pero' se tu dovessi valorizzare la massa di cliente con un valore per cliente, che cosa sceglieresti?

Perchè cosi' facendo posso produrre volantini senza supzerare ad esempio gli XX euro che ogni cliente mi rapporta.
Devo insomma calcolare il costo massimo di acquisizione cliente.

vict85
Che cos'è la massa di cliente?

clive999
scusa,
volevo solo dire "dare un valore" ad ogni cliente per sapere quanto spendere in pubblicità e conoscerne il costo massimo di acquisizione di nuovi clienti

vict85
Come ho già detto hai due problemi:
1) I tuoi dati vedono i singoli acquisti e non i dati comulativi dei singoli clienti.
Per esempio in un supermercato è probabile che uno che spenda 25€ a volta venga almeno 15 volte in un mese (io faccio parte di questa categoria). Ma è un supposuzione, non un dato.
2) Se tratti i dati per fare previsioni devi usare statistica inferenziale e test ipotesi vari. Non si tratta più di fare una media.

Inoltre se avessi i dati cumulativi potresti avere convenienza a categorizzare i clienti per abitudini di spesa.

clive999
Ciao,
se riuscissi a cumulare i clienti come procederesti?

vict85
La normale media dovrebbe darti il valore che cerchi. Ma sarebbe utile analizzare la correlazione tra spesa totale e spesa media dei clienti (a patto che elimini dal computo i clienti occasionali). Questi dati dovrebbero darti una descrizione abbastanza dettagliata dei tuoi clienti fissi.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.