Un metodo per pesare la media
Un cinema trasmette 3 film e una sera accoglie 301 spettatori che possono scegliere quale film vedere. Alla fine della proiezione daranno un voto da 1 a 5 al film che hanno visto. Ecco i risultati:
Primo film: 200 spettatori, media=4;
Secondo film: 100 spettatori, media=4;
Terzo film: 1 spettatore, media=5.
Il terzo film risulta quello con la media più alta mentre i primi due sono a pari merito. Quindi il terzo film è il più bello e gli altri due sono belli uguali.
Evidentemente c'è qualcosa che non va in questo ragionamento e l'ho esposto provocatoriamente. Ma come si fa a dare un peso alla media dei voti in base agli spettatori in modo che il voto 4 del primo film sia più valido del voto del secondo film e in un certo senso anche del terzo?
Primo film: 200 spettatori, media=4;
Secondo film: 100 spettatori, media=4;
Terzo film: 1 spettatore, media=5.
Il terzo film risulta quello con la media più alta mentre i primi due sono a pari merito. Quindi il terzo film è il più bello e gli altri due sono belli uguali.
Evidentemente c'è qualcosa che non va in questo ragionamento e l'ho esposto provocatoriamente. Ma come si fa a dare un peso alla media dei voti in base agli spettatori in modo che il voto 4 del primo film sia più valido del voto del secondo film e in un certo senso anche del terzo?
Risposte
Ammetto che l'esempio lasciava spazio alle considerazioni sensate che hai fatto tu, ma non era questa la mia richiesta. Non consideriamo la scelta di vedere un film piuttosto che un altro significativa, mettiamo che il numero di spettatori per ogni film sia randomica. Inoltre non soffermiamoci eccessivamente sulla questione "bellezza", supponiamo che gli spettatori siano in grado di esprime una bellezza assoluta in base ai loro gusti personali, pur senza aver visionato tutti e tre i film.
Faccio un altro esempio: lancio 1000 volte un dado a 6 facce e 700 volte esce il 5. Poi lancio un altro dado a 6 facce 10 volte e per 7 volte mi esce il 5. Perchè, intuitivamente, se dovessi scommettere su quale dei due dadi è truccato direi il primo? Ovviamente è perchè ho più prove a disposizione: su 10 lanci potrebbe essere un caso che sia uscito i 70% il 5, su 1000 lanci è meno probabile.
Quello che chiedo io è se esiste una misurazione di questo fatto. Vorrei una quantità che esprimesse questo concetto, un solo numero per pesare adeguatamente le coppie $(7/10,1000)$ e $(7/10,10)$. (Vorrei che questa quantità riuscisse a esprime anche il fatto che, nel caso il cui il primo dado mi avesse dato solo 699 volte il 5, io, come credo tutti, sarei portato a scommettere comunque su quel dado.)
Faccio un altro esempio: lancio 1000 volte un dado a 6 facce e 700 volte esce il 5. Poi lancio un altro dado a 6 facce 10 volte e per 7 volte mi esce il 5. Perchè, intuitivamente, se dovessi scommettere su quale dei due dadi è truccato direi il primo? Ovviamente è perchè ho più prove a disposizione: su 10 lanci potrebbe essere un caso che sia uscito i 70% il 5, su 1000 lanci è meno probabile.
Quello che chiedo io è se esiste una misurazione di questo fatto. Vorrei una quantità che esprimesse questo concetto, un solo numero per pesare adeguatamente le coppie $(7/10,1000)$ e $(7/10,10)$. (Vorrei che questa quantità riuscisse a esprime anche il fatto che, nel caso il cui il primo dado mi avesse dato solo 699 volte il 5, io, come credo tutti, sarei portato a scommettere comunque su quel dado.)
Quello che mi proponi è il rapporto tra le due probabilità, io però volevo un numero da associare ad ognuno dei casi indipendentemente dagli altri. Cioè: non voglio solo confrontare due situazione e decidere qual è la migliore ma voglio una quantità associata esclusivamente a una situazione. Mi potresti dire che questo numero è la probabilità, ma allora nell'esempio dei film come mi comporto? Io voglio un numero che sia collegato con la media ma che tenga conto anche dell'affidabilità di quest'ultima in base a quanti campioni ho utilizzato per stilarla.
Grazie delle tue risposte ragionate e precise, come sempre 
Il post precedente a quello che cito è un utile considerazione ma non risponde alla mia richiesta di avere un'unico numero che esprima media e affidabilità della media.
In che senso? In un esperimento randomizzato si tende a costituire gruppi di uguali dimensioni a meno che non intervengano fattori oggettivi che rendano la cosa impossibile o troppo onerosa.
Quali fattori potrebbero imporre di mostrare i film a numeri così diversi di persone?
Inoltre, se osservi quei tre numeri, 200 100 e 1, per i tre film, l'ipotesi che siano effetto del caso è decisamente poco credibile, più o meno quanto pensare che in 301 lanci di un dado regolare l'evento "esce un numero minore di tre" si verifichi una sola volta.[/quote]
Non ho detto che sia randomica questa distribuzione, ho di non considerarla come dato, come se fosse randomica.
Anche questa è un'ipotesi ben poco credibile. Che vuol dire bellezza assoluta in base ai gusti personali? È un ossimoro: se è "in base ai gusti personali" non può che essere relativa.[/quote]
Intendevo che ogni spettatore è in grado di esprime un giudizio assoluto rispetto ai film che ha visto, e soggettivo rispetto ai suoi gusti. Comunque ho usato l'esempio dei film per tentare di spiegare il concetto che non ero in grado di definire formalmente, per questo chiedevo di non tener conto della scelta dei film e della bellezza, perchè non volevo incidessero sulla definizione di questo concetto.
Faccio un altro esempio. Prendiamo un sito online di briscola. Supponiamo di voler stilare una classifica della forza dei giocatori. Un primo metodo è contare il numero dipartite vinte, è un metodo poco significativo perchè se io ho giocato 100 partite e le ho vinte tutte mi considero più forte di un giocatore che ne ha giocate 1000 e ne ha vinte 101. Un secondo metodo potrebbe essere considerare il rapporto vinte/giocate, così però, se io ne ho giocata 1 e l'ho vinta risulterei più forte di uno che ne ha giocate 100 e ne ha vinte 99. Utilizzando solo i dati di vinte e giocate come si può stilare una classifica ragionevole?

Il post precedente a quello che cito è un utile considerazione ma non risponde alla mia richiesta di avere un'unico numero che esprima media e affidabilità della media.
"Sergio":
Tornando all'esempio dei film,
[quote="nato_pigro"]Ammetto che l'esempio lasciava spazio alle considerazioni sensate che hai fatto tu, ma non era questa la mia richiesta. Non consideriamo la scelta di vedere un film piuttosto che un altro significativa, mettiamo che il numero di spettatori per ogni film sia randomica.
In che senso? In un esperimento randomizzato si tende a costituire gruppi di uguali dimensioni a meno che non intervengano fattori oggettivi che rendano la cosa impossibile o troppo onerosa.
Quali fattori potrebbero imporre di mostrare i film a numeri così diversi di persone?
Inoltre, se osservi quei tre numeri, 200 100 e 1, per i tre film, l'ipotesi che siano effetto del caso è decisamente poco credibile, più o meno quanto pensare che in 301 lanci di un dado regolare l'evento "esce un numero minore di tre" si verifichi una sola volta.[/quote]
Non ho detto che sia randomica questa distribuzione, ho di non considerarla come dato, come se fosse randomica.
"Sergio":
[quote="nato_pigro"] Inoltre non soffermiamoci eccessivamente sulla questione "bellezza", supponiamo che gli spettatori siano in grado di esprime una bellezza assoluta in base ai loro gusti personali, pur senza aver visionato tutti e tre i film.
Anche questa è un'ipotesi ben poco credibile. Che vuol dire bellezza assoluta in base ai gusti personali? È un ossimoro: se è "in base ai gusti personali" non può che essere relativa.[/quote]
Intendevo che ogni spettatore è in grado di esprime un giudizio assoluto rispetto ai film che ha visto, e soggettivo rispetto ai suoi gusti. Comunque ho usato l'esempio dei film per tentare di spiegare il concetto che non ero in grado di definire formalmente, per questo chiedevo di non tener conto della scelta dei film e della bellezza, perchè non volevo incidessero sulla definizione di questo concetto.
Faccio un altro esempio. Prendiamo un sito online di briscola. Supponiamo di voler stilare una classifica della forza dei giocatori. Un primo metodo è contare il numero dipartite vinte, è un metodo poco significativo perchè se io ho giocato 100 partite e le ho vinte tutte mi considero più forte di un giocatore che ne ha giocate 1000 e ne ha vinte 101. Un secondo metodo potrebbe essere considerare il rapporto vinte/giocate, così però, se io ne ho giocata 1 e l'ho vinta risulterei più forte di uno che ne ha giocate 100 e ne ha vinte 99. Utilizzando solo i dati di vinte e giocate come si può stilare una classifica ragionevole?
Anche al mio ultimo esempio dai risposta negativa?
