Confrontare percentuali su campioni diversi

sn1054m1
Salve, non so se questa è la sezione giusta però è un problema di statistica quindi spero vada bene.

Da un po' di tempo ho questo dubbio a cui non riesco a trovare soluzioni: come faccio a confrontare due percentuali fatte su campioni di dati (senza errori) diversi e indipendenti?

Per farvi capire meglio:
A e B lanciano una moneta, chi ottiene più volte testa vince; A fa 5 teste su 10, B ne fa 2 su 3, B dice di aver vinto perché il 67% dei suoi lanci è testa contro il 50% di quelli di A, ma A ha fatto più del triplo dei lanci di B, quindi chi ha vinto in realtà? E se il vincitore è A come fa a dimostrare a B che più è grande il campione più è "affidabile"/"valido" il risultato?

Questo ragionamento diventa banale nel caso in cui le percentuali siano uguali (50% su 100 lanci "vale" ovviamente di più di 50% su 20 lanci, ma perché?), però non riesco né a trovare né a pensare ad una legge generale nel caso di campioni anche molto diversi tra di loro.

So che errori/deviazioni standard ecc.. decrescono all'aumentare del numero degli elementi del campione ma nei casi a cui mi riferisco, così come in quello sopra della moneta, non ha senso calcolarli. Inoltre mi sembrerebbe una spiegazione molto approssimativa dire "ha più importanza/valore quello con l'N maggiore perché l'errore è più piccolo" che a me suona come "è così e basta", anche perché ci saranno sicuramente casi particolari in cui questo non è vero(?).

Grazie per l'aiuto, spero di essere stato chiaro.

Risposte
Lo_zio_Tom
"sn1054m1":

A e B lanciano una moneta, chi ottiene più volte testa vince; A fa 5 teste su 10, B ne fa 2 su 3, B dice di aver vinto perché il 67% dei suoi lanci è testa contro il 50% di quelli di A, ma A ha fatto più del triplo dei lanci di B, quindi chi ha vinto in realtà?



mettila così: vince chi fa qualche cosa di più difficile, cioè di meno frequente:


$P("5 successi su 10 lanci della moneta")~~24.6%$


$P("2 successi su 3 lanci della moneta")=37.5%$

Quindi vince A

Puoi anche "inventarti" tu un indicatore sensato, ad esempio $1/p$

Quindi il punteggio di A sarà 4.06 contro 2.67 di B.

EDIT:
Per esempi più articolati esistono numerose regole di decisione che puoi tranquillamente trovare sui libri. Qui, ad esempio, trovi una traccia di cosa cercare.

sn1054m1
Si ho capito, ma questo è comunque un ragionamento intuitivo seppur giusto.
Inoltre il tuo esempio dell' evento meno probabile può essere usato solo su un certo tipo di casi come quello della moneta ma già se parlo per esempio di chi vince più partite di calcio non ha senso parlare di probabilità come per un lancio di moneta e la cosa è diversa, perciò cerco una legge generale e più "rigorosa", per così dire.
Su internet non trovo niente, sui due libri di statistica e probabilità che ho usato per il laboratorio di Fisica non ho trovato niente, dove cerco..?

Edit: Riguardo all'esempio delle partite di calcio, A e B decidono che chi vince più partite è il più forte ma il numero di partite giocate da A è diverso dal numero di partite giocate da B. Le cose poi si complicano se a questa sfida partecipano anche gli altri membri delle squadre: se ognuno ha un numero di partite giocate diverso dagli altri io mi ritrovo a dover confrontare 22 percentuali (partite vinte / partite totali) con 22 campioni di dati diversi, come stabilisco chi dei 22 giocatori in questione è il più forte in questo caso?

sn1054m1
Ho visto dal link che hai postato il metodo esposto nella pagina di "pedagogia sperimentale" che usa questo test z (mai sentito fino ad ora, giuro che sui libri che ho usato non c'è haha) e sembra avvicinarsi a quello che cercavo però ci sono ancora delle cose che non capisco:
1) Se dovessi confrontare più di due campioni, dovrei trattarli comunque a due a due, giusto?
2) Non capisco perché "Per l’applicazione di questo test i due campioni devono avere entrambi più di 10 casi" (citando il sito)
3) Alla fine non ho capito cosa mi dia z, il numero che mi esce come risponde alla domanda "chi è il più forte"? e soprattutto perché cambiando l'ordine delle p al numeratore z può diventare negativo? che significato ha il segno di z?

Scusa per l'insistenza e per le domande ma finalmente credo di essere vicino alla risposta che cerco :v

EDIT:
Leggendo meglio dalle fonti che mi hai dato mi sono accorto che in effetti non rispondono per niente alla mia domanda.
Da quanto ho capito (correggimi/correggetemi se dico stron*ate), sia il test del chi quadro che questo test z servono a capire se la differenza tra le percentuali/proporzioni è dovuta al caso o no, ma a me sapere questa cosa non serve a niente, io voglio solo essere in grado di dire quale percentuale/proporzione tra quella di A e quella di B ha più valore/è più affidabile.

Lo_zio_Tom
"sn1054m1":
....E se il vincitore è A come fa a dimostrare a B che più è grande il campione più è "affidabile"/"valido" il risultato?


la prima domanda era differente[nota]questa onestamente non l'avevo letta, altrimenti non avrei nemmeno risposto, data la confusione che vedo leggendo bene tutto ciò che hai scritto[/nota]: vince chi fa più teste, non "vince chi fa un risultato più vicino al valore vero" che immagino tu intenda $mu=1/2$

Come fa A a dimostrare che più grande è il campione e più è valido il risultato? con 10 e 3 lanci non può perché una certa fluttuazione dei risultati è insita nella variabilità del fenomeno, come si può controllare, ad esempio, applicando i test che ti ho indicato.....ma sono solo due esempi di test applicabili.

Se invece i lanci fossero molti di più allora gli farebbe vedere (ed eventualmente gli dimostrerebbe) la legge forte dei grandi numeri[nota]che vale ovviamente sotto determinate condizioni:

Sia $(X_n)_(n>=1)$ una successione di v.a. i.i.d. e in $mathcal(L)^1$[/nota]

$P{lim_(n rarr+oo) bar(X)_n=mu}=1$



saluti

sn1054m1
So di non essere stato chiaro e mi dispiace aver confuso le idee anche a te ma non capisco perché continui a riferirti al caso della moneta, quello è un esempio (forse fin troppo semplice) per rendere l'idea del concetto generale alla base della mia domanda..
So come funziona un lancio di moneta (riferito alla statistica e alla probabilità), quello che voglio sapere è:
dati due campioni indipendenti $ N1 $ e $ N2 $ con $ N1!= N2 $ a cui sono associate due probabilità $ P1 $ e $ P2 $, esiste una formula/legge/teorema che mi consente di dire, conoscendo solo le coppie $ (N1,P1) $ e $ (N2,P2) $, quale tra $ P1 $ e $ P2 $ sia il risultato più affidabile?

E l'esempio, che a me pare abbastanza esplicativo è:

$A$ ha vinto $90/120$ partite, $B$ ne ha vinte $60/75$;

$A$ ha un win rate $w_A=75%$, $B$ ha un win rate $w_B=80%$;

I win rate sono simili e indicano che $B$ sia il migliore perchè $w_B>w_A$, però $A$ ha giocato molte più partite quindi non è che il suo $75%$ anche se minore "vale" più dell' $80%$ di $B$ ?
Come faccio a confrontare questi dati e a stabilire se effettivamente $w_A$ "vale" più di $w_B$ e a stabilire quindi chi è davvero il migliore?

EDIT:
Ecco ora mi sono accorto che forse sto sbagliando a parlare di probabilità, in realtà intendo una proporzione qualunque come nel caso dei win rate nell'esempio

Lo_zio_Tom
Forse non hai letto bene ciò che ho scritto ma a tale questione ho già risposto; considerando l'esempio che hai fatto, puoi applicare tranquillamente un test $chi^2$ e concludere che statisticamente non c'è un vincitore dato che la differenza fra i due win rate non è significativa.

Ti ho anche linkato un esercizio praticamente identico tutto risolto e commentato oltre ad una dispensa dettagliata con la spiegazione di come effettuare il test.

Lo stesso test può essere modificato ed applicato a $n$ campioni

Mi spiace ma più chiaro di così non saprei come fare; magari altri utenti potranno esserti più di aiuto.

Ciao

sn1054m1
Ho letto benissimo, il problema non è che non sei chiaro, è che stai rispondendo ad una domanda che non ho fatto.
I link che mi hai dato sono stati si utili, ma di nuovo, non c'entrano niente con la domanda che ho fatto.

Volevo provare a spiegarti di nuovo la questione, ma credo non ne valga la pena e non saprei in che altri modi provare a spiegarla, se non ci siamo capiti fino ad ora dubito che possa cambiare qualcosa continuando.

Grazie mille comunque per l'aiuto e la disponibilità!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.