Avrei bisogno di una mano

andreas11
sto studiando calcolo delle probabilità e mi son rimasti 3 problemi ancora sullo stomaco, ovvero ho difficoltà a risolverli. Qualcuno potrebbe darmi una mano?
Ecco il primo:
1)un'urna contiene m biglie tra bianche e nere. Se ne estraggono n < m a caso senza rimessa e di queste k risultano bianche. Qual è la probabilità che la prossima biglia estratta sia bianca?

Risposte
Sk_Anonymous
cari amici
a titolo di completamento di quanto detto nel precedente postato è forse utile approfondire un momento e dare qualche interessante esempio di applicazione.
Prima di tutto però ricordiamo la formula fondamentale che dalla conoscenza di un dato sperimentale [un dato evento si è verificato k volte in n esperimenti] permette di conoscere la statistica dell’evento in questione, ossia fornisce una stima della probabilità che esso si verifichi in successivi esperimenti]…

Prob (P[k,n]
Va subito detto che il calcolo diretto degli integrali che compaiono nella [1] è in pratica possibile solo per valori relativamente piccoli di n [diciamo per n<10…]. Per valori di n più elevati [che in pratica sono quelli che interessano] il calcolo diretto di intregrali di questo tipo diviene numericamente mal condizionato ma a ciò si può ovviare ricorrendo alla seguente formula di integrazione generale [ottenuta a partire dall’integrazione per parti]…

Int t^m * (1-t)^h dt = t^(m+1) * (1-t)^h /(m+h+1) + h/(m+h+1) * Int t^m * (1-t)^(h-1) dt [2]

L’uso ‘normale’ di questa formula consente ad ogni iterazione di ridurre di un grado il fattore (1-t) e le itreazioni hanno termine allorchè si raggiunge il grado 0. L’uso ‘alternativo’ consiste nel partire dall’integrale in cui il termine in (1-t) ha grado 0 ed arrivare fino all’integrale finale e questo consente un calcolo agevole e accurato dell’integrale anche per elevati valori di k ed n.

Dopo questa utile premessa proviamo ad esaminare due esempi concreti.

Esempio 1- Una ditta di elettronica per le proprie applicazioni utilizza fusibili professionali che acquista sul mercato a lotti, supponiamo di 10000 unità. Il contratto da essa sottoscritto con il fornitore le consente di respingere un lotto se in esso la percentuale di fusibili non a specifica è superiore all’1 %. Trattandosi nel caso dei fusibili di un test distruttivo [ossia essi devono interrompersi ad una certa corrente in un certo tempo] si decide di operare solo su di un numero ridotto di componenti scelti a caso nel lotto. Supponiamo di testare n=100 fusibili [perdendo così l’1 % del lotto] e che k siano i fusibili che non superano il test. Applicando la formula [1] si ha che:

se k=0 la probabilità che il tasso di fusibili difettosi sia < 1% è P=.6376 -> il lotto è accettato

se k=1 la probabilità che il tasso di fusibili difettosi sia <1% è P=.2679 -> il lotto è accettato

se k=2 la probabilità che il tasso di fusibili difettosi sua <1% è P=.0812 -> il lotto è respinto

…come ovviamente sarà se k>2…

Esempio 2 – L’esempio è particolarmente attuale poiché siamo in periodo elettorale. Una società specializzata comunica gli ‘exit pools’ subito dopo la chiusura dei seggi elettorali di una grande città [un milione o più di elettori...]. Le previsioni sono fatte in base alle risposte fornite da un numero n di intervistati scelti a caso. Supponiamo che di 1000 intervistati [n=1000] 450 [k=450] abbia dichiarato di aver votato per il signor Tizio. Valendosi sempre della formula [1] si trova che, se il valore aspettato della percentuale di voti ottenuta da Tizio è molto prossima al 45 %, essa è con probabilità del 98% è compresa tra i valori p1= .414 e p2=.487, che costituiscono la cosiddetta ‘forbice’. Infatti è

P[p(45,100)< .414] = .01 P[p(45,100]<.487]=.99

E’ noto che più di una volta gli ‘exit pools’ hanno fornito dati del tutto disattesi dai successivi scrutini. Ciò può essere dovuto a varie cause come…

- gli intervistati non hanno fornito risposte veritiere

- gli intervistati non erano un 'campionario' statisticamente valido

- vi sono stati dei brogli

… è noto però che l’ultima possibilità è quella che non si verifica mai…

cordiali saluti

lupo grigio






Modificato da - lupo grigio il 09/06/2003 10:53:02

Sk_Anonymous
caro andreas
il problema da te posto è del massimo interesse ed è assai frequente nella pratica. Supponiamo di voler stimare la probabilità,a priori incognita, di un certo evento [nell’esempio da te fornito ‘biglia estratta a caso di colore bianco’] procedendo in maniera sperimentale. L’approccio che darebbe il risultato ‘esatto’ sarebbe ovviamente quello di eseguire m rilievi [ossia in questo caso di estrarre tutte le m biglie dall’urna] e se l’evento si verifica b volte [ossia vengono estratte b biglie di colore bianco] assegnare alla probabilità incognita il valore Pa= b/m.
Un tale approccio tuttavia o non è possibile [se m per esempio è un numero molto grande] o non è pratico o non è economicamente conveniente per cui nella pratica occorre eseguire un numero di esperimenti n che il più delle volte è molto inferiore ad m [n<
P[k,n] = (n,k) p^k*(1-p)^(n-k) [1]

… ove con (n,k) si intendono i ‘coefficienti binomiali’ dati da

(n,k)= n!/[k!*(n-k)!] [2]

La formula [1] risolve il ’problema diretto’, ossia nota a priori la probabilità p di un evento trovare la probabilità che esso si verifichi k volte in n esperimenti. Tuttavia il quesito da te posto si riferisce al ‘problema inverso’, vale a dire dalla conoscenza del risultato di n sperimentazioni ‘stimare’ quale può essere la probabilità p, a priori incognita. Un approccio intuitivo alla soluzione del ‘problema inverso’ può essere il seguente…

Partendo dalla formula [1], con n e k noti, si può determinare la probabilità che P[k,n] < x [con 0
Prob (P[k,n]
Il polinomio in t che compare negli integrali della [3] è facilmente calcolabile e vale…

Po(t)=t^k*(1-t)^(n-k) = Sum [0<=i<=n-k] (-1)^i * (n-k,i)*t^(k+i) [4]

… come pure il suo integrale che vale…

Int Po(t) dt = Sum [0<=i<=n-k] (-1)^i* (n-k,i)* t^(k+i+1)/(k+i+1) + c [5]

Dopo questi facili passaggi arriviamo a scrivere la [3] in una forma assai interessante ed utile…

Prob (P[k,n]
… ove g(t) = 1/a * Sum [0<=i<=n-k] (-1) ^i * (n-k,i) * t^(k+i), con a= Sum [0<=i<=n-k] (-1)^i * (n-k,i)/(k+i+1)

La g(t) ora definita è a tutti gli effetti una funzione densità di probabilità [questo è un caso singolare nel quale la grandezza di cui si vuole determinare la probabilità è essa stessa una probabilità…] e può servire a stimare il valor medio e la varianza della v.a. p.

Facciamo qualche esempio semplice per chiarire meglio le cose…

Supponiamo da prima n=1. In tal caso il numero di biglie estratte di colore bianco può essere 0 o 1.

per k=0 abbiamo a= 1-1/2=1/2 g(t)= 2*(1-t)
e quindi E

= Int [0
per k=1 abbiamo a= 1-1/2=1/2 g(t)= 2t
e quindi E

= Int[0
In altre parole se nell’unico esperimento esce una biglia nera il valore stimato di probabilità che in una successiva estrazione esca una biglia bianca è pari a 1/3, se esce biglia bianca è pari a 2/3.

Supponiamo ora n=2. In tal caso il numero di biglie estratte di colore bianco può essere 0,1 o 2.

per k=0 abbiamo a= 1-1+1/3=1/3 g(t)=3*(1-2*t+t^2)
e quindi Int[0
per k=1 abbiamo a= 1-1/2 =1/2 g(t)= 2*(t-t^2)
e quindi Int [0
per k=2 abbiamo a= 1/3 g(t) = 3* t^2
e quindi Int [0
In altre parole se in due esperimenti non esce alcuna biglia bianca il valore stimato di probabilità che nella successiva estrazione esca biglia bianca è pari a ¼, se esce una biglia bianca è pari a ½, se escono due biglie bianche è pari a ¾.

Naturalmente è possibile andare avanti con il calcolo per n=3,4… e così via, cosa che lascio a te come divertente esercizio. La conoscenza della g(t) oltre che il valor medio naturalmente consente il calcolo della varianza… e questo ci consentirà magari in prossimi interventi di fare alcune interessanti considerazioni…

cordiali saluti

lupo grigio


Angelo210
Il tuo problema si presente in maniera alquanto strana, infatti non essendoci alcuna informazione sul colore delle biglie che sono rimaste nell'urna, la probabilità di estrarre una biglia bianca potrebbe essere qualunque anche 0 o 1: 0 se dentro l'urna sono rimaste solo biglie nere, 1 viceversa se nell'urna sono rimaste solo biglie bianche.

L'unico modo di raggirare l'ostacolo è quello di ricavare il numero b delle biglie bianche inizialmente presenti nell'urna, ma questo è impossibile con i dati del problema a meno che non si aggiunga qualche altra ipotesi.

Per esempio, si potrebbe aggiungere l'ipotesi che k coincida con il valore medio della distribuzione binomiale associata al quesito, cioè k valga n*p dove p è la probabilità di estrarre inizialmente una biglia bianca.

Con questa ipotesi aggiuntiva, si avrebbe,

p=b/m, con b numero totale di biglie bianche,
k=n*p.

In questo modo si potrebbe ricavare b,

b=k*m/n

e la probabilità che la prossima biglia estratta sia bianca, sarebbe,

P=(b-k)/(m-n)=(k*m/n-k)/(m-n)=k/n, ossia,

P=k/n.

Angelo

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.