Avrei bisogno di una mano
Ecco il primo:
1)un'urna contiene m biglie tra bianche e nere. Se ne estraggono n < m a caso senza rimessa e di queste k risultano bianche. Qual è la probabilità che la prossima biglia estratta sia bianca?
a titolo di completamento di quanto detto nel precedente postato è forse utile approfondire un momento e dare qualche interessante esempio di applicazione.
Prima di tutto però ricordiamo la formula fondamentale che dalla conoscenza di un dato sperimentale [un dato evento si è verificato k volte in n esperimenti] permette di conoscere la statistica dell’evento in questione, ossia fornisce una stima della probabilità che esso si verifichi in successivi esperimenti]…
Prob (P[k,n]
Va subito detto che il calcolo diretto degli integrali che compaiono nella [1] è in pratica possibile solo per valori relativamente piccoli di n [diciamo per n<10…]. Per valori di n più elevati [che in pratica sono quelli che interessano] il calcolo diretto di intregrali di questo tipo diviene numericamente mal condizionato ma a ciò si può ovviare ricorrendo alla seguente formula di integrazione generale [ottenuta a partire dall’integrazione per parti]…
Int t^m * (1-t)^h dt = t^(m+1) * (1-t)^h /(m+h+1) + h/(m+h+1) * Int t^m * (1-t)^(h-1) dt [2]
L’uso ‘normale’ di questa formula consente ad ogni iterazione di ridurre di un grado il fattore (1-t) e le itreazioni hanno termine allorchè si raggiunge il grado 0. L’uso ‘alternativo’ consiste nel partire dall’integrale in cui il termine in (1-t) ha grado 0 ed arrivare fino all’integrale finale e questo consente un calcolo agevole e accurato dell’integrale anche per elevati valori di k ed n.
Dopo questa utile premessa proviamo ad esaminare due esempi concreti.
Esempio 1- Una ditta di elettronica per le proprie applicazioni utilizza fusibili professionali che acquista sul mercato a lotti, supponiamo di 10000 unità. Il contratto da essa sottoscritto con il fornitore le consente di respingere un lotto se in esso la percentuale di fusibili non a specifica è superiore all’1 %. Trattandosi nel caso dei fusibili di un test distruttivo [ossia essi devono interrompersi ad una certa corrente in un certo tempo] si decide di operare solo su di un numero ridotto di componenti scelti a caso nel lotto. Supponiamo di testare n=100 fusibili [perdendo così l’1 % del lotto] e che k siano i fusibili che non superano il test. Applicando la formula [1] si ha che:
se k=0 la probabilità che il tasso di fusibili difettosi sia < 1% è P=.6376 -> il lotto è accettato
se k=1 la probabilità che il tasso di fusibili difettosi sia <1% è P=.2679 -> il lotto è accettato
se k=2 la probabilità che il tasso di fusibili difettosi sua <1% è P=.0812 -> il lotto è respinto
…come ovviamente sarà se k>2…
Esempio 2 – L’esempio è particolarmente attuale poiché siamo in periodo elettorale. Una società specializzata comunica gli ‘exit pools’ subito dopo la chiusura dei seggi elettorali di una grande città [un milione o più di elettori...]. Le previsioni sono fatte in base alle risposte fornite da un numero n di intervistati scelti a caso. Supponiamo che di 1000 intervistati [n=1000] 450 [k=450] abbia dichiarato di aver votato per il signor Tizio. Valendosi sempre della formula [1] si trova che, se il valore aspettato della percentuale di voti ottenuta da Tizio è molto prossima al 45 %, essa è con probabilità del 98% è compresa tra i valori p1= .414 e p2=.487, che costituiscono la cosiddetta ‘forbice’. Infatti è
P[p(45,100)< .414] = .01 P[p(45,100]<.487]=.99
E’ noto che più di una volta gli ‘exit pools’ hanno fornito dati del tutto disattesi dai successivi scrutini. Ciò può essere dovuto a varie cause come…
- gli intervistati non hanno fornito risposte veritiere
- gli intervistati non erano un 'campionario' statisticamente valido
- vi sono stati dei brogli
… è noto però che l’ultima possibilità è quella che non si verifica mai…


cordiali saluti
lupo grigio

Modificato da - lupo grigio il 09/06/2003 10:53:02
il problema da te posto è del massimo interesse ed è assai frequente nella pratica. Supponiamo di voler stimare la probabilità,a priori incognita, di un certo evento [nell’esempio da te fornito ‘biglia estratta a caso di colore bianco’] procedendo in maniera sperimentale. L’approccio che darebbe il risultato ‘esatto’ sarebbe ovviamente quello di eseguire m rilievi [ossia in questo caso di estrarre tutte le m biglie dall’urna] e se l’evento si verifica b volte [ossia vengono estratte b biglie di colore bianco] assegnare alla probabilità incognita il valore Pa= b/m.
Un tale approccio tuttavia o non è possibile [se m per esempio è un numero molto grande] o non è pratico o non è economicamente conveniente per cui nella pratica occorre eseguire un numero di esperimenti n che il più delle volte è molto inferiore ad m [n<
P[k,n] = (n,k) p^k*(1-p)^(n-k) [1]
… ove con (n,k) si intendono i ‘coefficienti binomiali’ dati da
(n,k)= n!/[k!*(n-k)!] [2]
La formula [1] risolve il ’problema diretto’, ossia nota a priori la probabilità p di un evento trovare la probabilità che esso si verifichi k volte in n esperimenti. Tuttavia il quesito da te posto si riferisce al ‘problema inverso’, vale a dire dalla conoscenza del risultato di n sperimentazioni ‘stimare’ quale può essere la probabilità p, a priori incognita. Un approccio intuitivo alla soluzione del ‘problema inverso’ può essere il seguente…
Partendo dalla formula [1], con n e k noti, si può determinare la probabilità che P[k,n] < x [con 0
Prob (P[k,n]
Il polinomio in t che compare negli integrali della [3] è facilmente calcolabile e vale…
Po(t)=t^k*(1-t)^(n-k) = Sum [0<=i<=n-k] (-1)^i * (n-k,i)*t^(k+i) [4]
… come pure il suo integrale che vale…
Int Po(t) dt = Sum [0<=i<=n-k] (-1)^i* (n-k,i)* t^(k+i+1)/(k+i+1) + c [5]
Dopo questi facili passaggi arriviamo a scrivere la [3] in una forma assai interessante ed utile…
Prob (P[k,n]
… ove g(t) = 1/a * Sum [0<=i<=n-k] (-1) ^i * (n-k,i) * t^(k+i), con a= Sum [0<=i<=n-k] (-1)^i * (n-k,i)/(k+i+1)
La g(t) ora definita è a tutti gli effetti una funzione densità di probabilità [questo è un caso singolare nel quale la grandezza di cui si vuole determinare la probabilità è essa stessa una probabilità…] e può servire a stimare il valor medio e la varianza della v.a. p.
Facciamo qualche esempio semplice per chiarire meglio le cose…
Supponiamo da prima n=1. In tal caso il numero di biglie estratte di colore bianco può essere 0 o 1.
per k=0 abbiamo a= 1-1/2=1/2 g(t)= 2*(1-t)
e quindi E
= Int [0
per k=1 abbiamo a= 1-1/2=1/2 g(t)= 2t
e quindi E
= Int[0
In altre parole se nell’unico esperimento esce una biglia nera il valore stimato di probabilità che in una successiva estrazione esca una biglia bianca è pari a 1/3, se esce biglia bianca è pari a 2/3.
Supponiamo ora n=2. In tal caso il numero di biglie estratte di colore bianco può essere 0,1 o 2.
per k=0 abbiamo a= 1-1+1/3=1/3 g(t)=3*(1-2*t+t^2)
e quindi Int[0
per k=1 abbiamo a= 1-1/2 =1/2 g(t)= 2*(t-t^2)
e quindi Int [0
per k=2 abbiamo a= 1/3 g(t) = 3* t^2
e quindi Int [0
In altre parole se in due esperimenti non esce alcuna biglia bianca il valore stimato di probabilità che nella successiva estrazione esca biglia bianca è pari a ¼, se esce una biglia bianca è pari a ½, se escono due biglie bianche è pari a ¾.
Naturalmente è possibile andare avanti con il calcolo per n=3,4… e così via, cosa che lascio a te come divertente esercizio. La conoscenza della g(t) oltre che il valor medio naturalmente consente il calcolo della varianza… e questo ci consentirà magari in prossimi interventi di fare alcune interessanti considerazioni…
cordiali saluti
lupo grigio
L'unico modo di raggirare l'ostacolo è quello di ricavare il numero b delle biglie bianche inizialmente presenti nell'urna, ma questo è impossibile con i dati del problema a meno che non si aggiunga qualche altra ipotesi.
Per esempio, si potrebbe aggiungere l'ipotesi che k coincida con il valore medio della distribuzione binomiale associata al quesito, cioè k valga n*p dove p è la probabilità di estrarre inizialmente una biglia bianca.
Con questa ipotesi aggiuntiva, si avrebbe,
p=b/m, con b numero totale di biglie bianche,
k=n*p.
In questo modo si potrebbe ricavare b,
b=k*m/n
e la probabilità che la prossima biglia estratta sia bianca, sarebbe,
P=(b-k)/(m-n)=(k*m/n-k)/(m-n)=k/n, ossia,
P=k/n.
Angelo