QIM - Quesito sui multiaccount

bucarella
Dopo aver letto molti commenti a riguardo su questo forum in seguito al fantomatico quesito del pallone da basket, vi propongo un quesito:
"Ad un test basato su indovinelli matematici, viene presentato una test con 5 possibili risposte. Ogni account puo rispondere solo una volta ad ogni quesito.
Tutti i partecipanti usano la tecnica del multiaccount: questi non risolvono il quesito, bensì hanno a disposizione 5 account di prova per tentare di dare la risposta giusta; una volta trovata la risposta usano l'account "ufficiale" e ovviamente rispondono correttamente; supponendo che le risposte date con gli account di prova vengano date a caso (ma quantomeno vengano scartate le risposte gia date con gli altri account di prova afferenti allo stesso account ufficiale), stabilire quanti IN MEDIA rispondono bene su un totale di 100 utenti."
BUON LAVORO

Risposte
cenzo1
Interessante quesito :-D ... ci stavo ragionando proprio ieri!

Domanda: se l'utente indovina diciamo al secondo tentativo con un account "fake", è in grado di indovinare con l'account ufficiale. Con gli altri due account "fake" che farà? Li usa o no? (se si, concordi che metterà la risposta corretta?)

milizia96
"bucarella":
stabilire quanti IN MEDIA rispondono bene su un totale di 100 utenti."

Per "utenti" si intende ogni effettivo partecipante o il numero complessivo degli account?
Altra domanda: se un partecipante risponde correttamente usando un account di prova andrà a rispondere direttamente con quello "ufficiale" lasciando perdere gli account di prova rimasti oppure continuerà a provare con gli account di prova? In quest'ultimo caso, risponde correttamente anche sugli account rimasti o continua a provare le risposte rimaste?
Ultimo dubbio: gli account di un utente sono complessivamente 5 oppure 6? (5 di prova + 1 ufficiale)

xXStephXx
In realtà sarebbero sufficienti due account. (Quindi si può semplificare il problema).
Come gareggianti su 100 dovrebbero essere inclusi sia l'account originale che quello di prova.
Le possibili risposte sono variabili. C'è da stabilire un numero. (mettiamo che ci siano sempre 6 risposte possibili).
In quel caso ogni utente ha 1/6 delle possibilità di indovinare con due account e 5/6 di indovinare con solo un account.

bucarella
effettivamente non sono stato molto chiaro, quindi:

ogni utente in totale ha 5 account, e puo scegliere solo fra 5 risposte
100 sono gli account che compaiono in classifica
tutti i gaerggianti sono truffaldini e gareggiano in questo modo:

da una singola risposta a caso con il primo account fasullo, se la risposta è giusta allora accede con l'account !"da competizione" e risponde bene, altrimenti accede con il secondo account di prova e risponde tenendo in conto della risp che sa che sia sbagliata; se la risposta è giusta allora accede con l'account !"da competizione" e risponde bene, altrimenti accede con il terzo account di prova e risponde tenendo in conto delle risp che sa che siano sbagliate; se la risposta è giusta allora accede con l'account !"da competizione" e risponde bene, altrimenti accede con il quarto account di prova e risponde tenendo in conto della risp che sa che siano sbagliate; a questo accede con l'account "da competizione" e sa la risposta giusta sia che abbia risposto bene o male al quarto tentativo

Detto ciò vi propongo la mia soluzione

se risponde bene con il primo account di prova, allora il gareggiante darà due volte la risposta esatta (con due account differenti). questo evento ha probabilità 1/5
se risp bene con il secondo account di prova, allora il gareggiante darà due risp esatte e un'errata P=1/5
se risp bene con il terzo account di prova, allora il gareggiante darà 2 risp esatte e 2 errate 2 P=1/5
se risp bene con il quarto account di prova, allora il gareggiante darà 2 risp esatte e 3 errate 2 P=1/5
se risp male con il quarto account di prova, allora il gareggiante darà 1 risp esatte e 4 errate 2 P=1/5

CONCLUSIONE
Mediamente un gareggiante truffaldino da in media 1/5*(2+3+4+5+5)=19/5 risposte di cui sono mediamente esatte 1/5*(2+2+2+2+1)=9/5
Mediamente quindi le risposte esatte saranno 9/19. dunque se in classifica compaiono 100 utenti i 9/19 di questi rispondono esattamente cioè 47,36

Spero di esser stato chiaro e non aver commesso errori

snisna
Si mi pare corretto

EISguys
No...non direi proprio che sia corretto...(ammesso che io abbia interpretato bene il problema)
Faccio in prima battuta solo un ragionamento per capire come il risultato di bucarella sia sbagliato.

Come spiegato da bucarella, in un solo caso un utente darà solo 1 risposta esatta, cioè il caso in cui ha sbagliato tutte e 4 le volte precedenti. In tutti gli altri casi l'utente darà sempre 2 risposte esatte: una "truffaldina" e una "da competizione". Ora, giusto per fare una stima (una SOVRASTIMA), facciamo finta che di fatto ogni giocatore (che 5 account diversi di cui uno da competizione) dia sempre 2 risposte esatte: una con l'account da competizione e l'altra con un account qualsiasi di quelli che ha. Quindi se i giocatori sono 20, ciascuno darà 2 risposte esatte e quindi avremo in classifica 40 risposte esatte. Ma questa è già una sovrastima! quindi il risultato deve essere <40. Ragione per cui il risultato 47,36 non può essere giusto. Significherebbe che almeno 1 giocatore ha dato più di due risposte esatte...e non ha senso!

Viceversa conviene ragionare così: l'unico caso in cui l'utente non darà 2 risposte è quello in cui prima sbaglia con i 4 account "fasulli" e poi risponde giusto con quello "da competizione", ma questo fatto accade con una probabilità di $4/5 * 3/4 * 2/3 * 1/2 * 1 = 1/5$. In tutti gli altri casi, l'utente darà 2 risposte esatte, questo accadrà con una probabilità $4/5$. Per tanto ogni utente darà un numero di risposte esatte, in media, pari a $1/5 * 1+4/5*2=9/5$ (cioè quasi 2...come ragionevole che sia). Se gli utenti sono 20, allora il numero totale, in media, di risposte esatte sarà $9/5 * 20 =36$.

Spero di essere stato chiaro.
ciao ciao

snisna
Hai interpretato male. 47,36 è la percentuale di risposte esatte sul totale di risposte date.

E' vero che in caso di 20 utenti mi aspetto 36 risposte esatte, ma è anche vero che mi aspetto anche 40 risposte sbagliato (perché ho 1/5 di probabilità che ogni utente risponda con 0 account in modo sbagliato, 1/5 che ne risponda con 1, 1/5 che ne risponda con 2, 1/5 che ne risponda con tre e 1/5 che ne risponda con 4).

Quindi ho 4*(1/5)+3*(1/5)+2*(1/5)+1*(1/5)+0*(1/5) = 10/5 = 2

Con 20 utenti ho 40 risposte sbagliate.

Di conseguenza 36 esatte, 40 sbagliate, totale 76. la percentuale di risposte esatte sul totale è di 36/76 = 0,4736 ovvero 47,36%

bucarella
"EISguys":
No...non direi proprio che sia corretto...(ammesso che io abbia interpretato bene il problema)
Faccio in prima battuta solo un ragionamento per capire come il risultato di bucarella sia sbagliato.

Come spiegato da bucarella, in un solo caso un utente darà solo 1 risposta esatta, cioè il caso in cui ha sbagliato tutte e 4 le volte precedenti. In tutti gli altri casi l'utente darà sempre 2 risposte esatte: una "truffaldina" e una "da competizione". Ora, giusto per fare una stima (una SOVRASTIMA), facciamo finta che di fatto ogni giocatore (che 5 account diversi di cui uno da competizione) dia sempre 2 risposte esatte: una con l'account da competizione e l'altra con un account qualsiasi di quelli che ha. Quindi se i giocatori sono 20, ciascuno darà 2 risposte esatte e quindi avremo in classifica 40 risposte esatte. Ma questa è già una sovrastima! quindi il risultato deve essere <40. Ragione per cui il risultato 47,36 non può essere giusto. Significherebbe che almeno 1 giocatore ha dato più di due risposte esatte...e non ha senso!

Viceversa conviene ragionare così: l'unico caso in cui l'utente non darà 2 risposte è quello in cui prima sbaglia con i 4 account "fasulli" e poi risponde giusto con quello "da competizione", ma questo fatto accade con una probabilità di $4/5 * 3/4 * 2/3 * 1/2 * 1 = 1/5$. In tutti gli altri casi, l'utente darà 2 risposte esatte, questo accadrà con una probabilità $4/5$. Per tanto ogni utente darà un numero di risposte esatte, in media, pari a $1/5 * 1+4/5*2=9/5$ (cioè quasi 2...come ragionevole che sia). Se gli utenti sono 20, allora il numero totale, in media, di risposte esatte sarà $9/5 * 20 =36$.

Spero di essere stato chiaro.
ciao ciao


hai supposto IMPLICITAMENTE sin dalla partenza che se compaiono 100 account in classifica essi corrispondano a 20 gareggianti: il numero stesso di risposte è una variabile aleatoria e anche quella va caratterizzata; per fare un esempio se indovini con il primo account fasullo il gareggiante userà solo due account.

Il tuo ragionamento risulterebbe esatto solo qualora il gareggiante dia sempre quattro risposte con gli account di prova e fatto ciò risponda con l'account "da competizione".

L'unica alternativa che vedo al problema così posto è dato dalla possibilità che al gareggiante venga in mente di usare comunque tutti e 5 i suoi account, ma una volta dedotta la risposta esatta risponda sempre bene......in questo caso: conviene caratterizzare la variabile aleatoria risposte sbagliate X:
se risp bene al primo tentativo allora $P(X=0)=1/5$
se risp bene al secondo tentativo allora $P(X=1)=1/5$
se risp bene al terzp tentativo allora $P(X=2)=1/5$
se risp bene al quarto tentativo allora $P(X=3)=1/5$
se risp male anche al quarto tentativo allora $P(X=4)=1/5$
CONCLUSIONE se compaiono 100 utenti, allora hanno risposto 20 gareggianti; ogni gareggiante mediamente risponde male $E[X]=1/5*(0+1+2+3+4)=2$ quindi avremo $40$ risposte sbagliate e ben $60$ risposte corrette...........60

dato che nel quesito del pallone solo 1/3 degli utenti aveva risposto bene significa che solo in pochi avevano usato questo metodo, molti avevano invece semplicemente risposto a caso

EISguys
eh eh ... non avevo afferrato il carattere "investigativo" del problema e quindi non mi ero immedesimato a sufficienza!! Allora diciamo che il problema è il seguente: sia dato un quesito a risposta multipla (5 risposte possibili) con tutte le risposte sbagliate e ugualmente inverosimili (in modo da escludere una tendenza verso una qualche risposta in particolare), così che l'unico modo per rispondere è affidarsi al caso o alla truffa. Diciamo che tra tutti ci sono $n$ concorrenti truffaldini che si sono anticipatamente creati 5 account (4 "falsi" e uno "da competizione"). Diciamo che usano questi account nella maniera più verosimile possibile, cioè, se trovano con il secondo account (avendo sbagliato col primo) la soluzione, rispondono direttamente con quello "da competizione", in questo modo non ci sarà traccia in classifica degli altri 2 account che avevano a disposizione. ok?
Quindi ora il problema è, dato che in classifica ci sono N nomi e dato che solo 1/3 di questi ha fornito la risposta esatta, stimiamo quanti sono i concorrenti "truffaldini" in questa gara. Mi pare ben formulato il problema no? Anche fico anzi! :)

SOLUZIONE

Io direi quindi, in base a quanto ho già mostrato nell'altro post, che il numero medio di account, usati dai bari, che risultano in classifica con la risposta giusta è $g_b=9/5 n$.
viceversa, per quanto mostrato da bucarella, il numero medio di account, usati dai bari, che risultano in classifica con la risposta sbagliata è $s_b=2n$

A questo punto in classifica però ci saranno anche gli account che hanno risposto giusto degli utenti leali, $g_l$, e quelli che hanno risposto sbagliato, $s_l$.

Quindi il totale degli account con la risposta giusta saranno $g=g_b + g_l=9/5 n + g_l$
gli altri $s=s_b+s_l=2n+s_l$.

Supponendo che i "leali" non hanno potuto che rispondere a caso, sarà:
$g_l=1/5 l$
$s_l=4/5 l$

con "l" il numero dei "leali".

quindi ho un sistema di due equazioni
$ g=9/5 n + 1/5 l$
$ s=2n + 4/5l$

faccio in modo di eliminare la "l" e ricavo $n=5/26 (4g-s)$.
Secondo quanto detto da bucarella $g/N=1/3$ e quindi $s/N=2/3$, quindi la percentuale dei bari è

$n/N=5/26(4/3-2/3)=12.8%$

Che ne dite? Ora è corretto?

bucarella
Sono arrivato allo stesso risultato in maniera differente

Definito l'evento RE=risposta esatta
Posto x la frequenza relativa di account afferenti a bari presenti in classifica; questi rispondono bene con $P(RE|BARO)=0.473$
posto y la frequenza relativa di account afferenti a onesti presenti in classifica; questi rispondono bene con $P(RE|LEALE)=0.2$
Dato che o si è bari o si è leali vale $y=x-1$
Dall'osservazione dei dati risulta e applicando il teorema della probabilità totale $0.473x+(1-x)0.2=0.333$
da cui $x=0.487$
Dato che ad ogni gareggiante baro corrispondono mediamente 19/5 di account bari (numero di risposte medie dato da un baro) allora se ci sono 100 account in classifica vi saranno $12.81$ utenti bari
ATTENZIONE questa però non è la percentuale di gareggianti bari, per il numero totale di gareggianti è data da gareggiantibari+gareggiantileali i gareggianti leali sono tanti quanti i loro account cioè $100(1-x)=51.3$ quindi in totale i gareggianti sono $12.81*51.3=64.11$.
CONCLUSIONE la percentuale di gareggianti bari che rispose al quiz del pallone è circa del $12.81/64.11*100=19.98$
IL VENTI PER CENTO

spero anch'io di non aver sbagliato nulla; nel caso opposto dovrei fare l'investigatore non l'ingegner

EISguys
eh si hai ragione.. N è il numero degli account, non degli effettivi partecipanti...ora non ho guardato con attenzione al tuo procedimento (ho proseguito col mio), e a me viene una percentuale di bari del 19.96 %, direi, a meno di qualche approssimazione, come a te! Il che non mi sembra molto incoraggiante! il 20% è tanto!!
C'è però da dire, se vogliamo sempre tornare nel caso "investigativo", che tanti concorrenti "leali" non hanno risposto al quesito non trovando la soluzione corretta...mentre diciamo che i bari hanno risposto tutti...quindi diciamo che in realtà la percentuale dei bari è più bassa del 20%...spero... :P
Per fare un test sarebbe interessante se gli autori del sito ponessero appositamente un test sbagliato forzando però tutti i "giocatori" a rispondere...ma dopo questi post di fronte ad un quesito senza soluzione i bari smetteranno di utilizzare gli account fasulli...e tutti i nostri conti e l'amore per la statistica vanno a farsi benedire! :)

ciaoooooooooo

snisna
"EISguys":
...ma dopo questi post di fronte ad un quesito senza soluzione i bari smetteranno di utilizzare gli account fasulli...e tutti i nostri conti e l'amore per la statistica vanno a farsi benedire! :)


Sempre che se ne accorgano... :)

bucarella
"EISguys":
tanti concorrenti "leali" non hanno risposto al quesito non trovando la soluzione corretta...mentre diciamo che i bari hanno risposto tutti...quindi diciamo che in realtà la percentuale dei bari è più bassa del 20%...spero... :P


quoto assolutamente
in ogni caso era chiaro dal principio che era solo un gioco, più che un'indagine anche se abbiamo dimenticato di ricavare il dato più significativo
degli account che hanno dato la risposta esatta il
$0.473*0.4872*100/(1/3)=69%$
erano account afferenti a BARI
se tale percentuale fosse stata tipo del 95% allora FORSE si sarebbe potuto intervenire

EISguys
già...comunque è stato divertente risolvere il problema! :) Magari fossero tutti così i problemi del Q.I.M.!! :P Ma immagino che impiegherei più di 5 minuti al giorni per risolverli! Se non ricordo male una volta la gara era articolata in modo piuttosto diverso: problemi più difficili da risolvere in più tempo (tipo una settimana..non ricordo) inviando la propria soluzione (con il procedimento, qualunque esso fosse stato) a colui che aveva proposto il quesito. Devo dire che era, per quanto mi riguarda, più stimolante...ora sostanzialmente, almeno in questa fase, la gara consiste in una caccia al centesimo di bonus che si ottiene rispondendo un picosecondo prima dell'altro concorrente..
va beh...immagino che in questa formula, la gara riesca a coinvolgere più utenti senza richiedere a qualcuno di caricarsi del peso di starsi a leggere tutte le soluzioni inviate!

alla prossima!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.