Calcolo distribuzione di probabilità

givabon
Salve a tutti, sono nuovo e chiedo aiuto per venire a capo di un problema che sto affrontando più che altro per diletto, ma che è ampiamente al di là delle mie conoscenze in campo probabilistico (ho fatto un esame all'università una quindicina di anni fa)...

Dunque, io ho un insieme di variabili (diciamo 10 ma si può generalizzare), le quali hanno ognuna una distribuzione uniforme continua all'interno dell'intervallo 0-10 (l'estremo superiore generalizzabile ma sempre positivo, quello inferiore fisso).
Ora a me interesserebbe estrarre quante più informazioni possibili sulla distribuzione di probabilità che ha la variabile avente il valore più basso tra le 10. Ossia, supponendo di distribuire le 10 variabili nell'intervallo detto, avrò sempre che una di esse "capiterà" in un valore più basso di tutte le altre... quello che vorrei capire è come si distribuisce questo "valore più basso" nell'intervallo 0-10. Vorrei auspicabilmente arrivare ad una formula della sua distribuzione... o almeno valore medio e varianza
(chiedo scusa per la terminologia terra terra...)

L'unico passo avanti concettuale che avevo fatto (per altro forse sbagliato) era considerare che la probabilità che il valore più basso tra i 10 sia maggiore di x (con x valore generico compreso in [0, 10]) equivale in un certo senso alla probabilità che tutte e 10 le variabili abbiano conseguito un valore maggiore di x (e minore di 10).

La P(X1>x, ..., X10>x) l'ho considerata pari a P(X1>x)*...*P(X10>x) perchè ritengo che siano indipendenti, e P(Xn>x) = 1 - P(Xnx, ..., X10>x) è pari a (1-x/10)^10.
Questa formula non mi torna molto a causa del fatto che calcolata tra 10 e 0 mi restituisce -1 invece di 1. Inoltre credo che sia troppo semplicistica l'ipotesi a monte di tutto...

Potreste farmi capire come si approccia analiticamente un problema del genere?
Vi ringrazio e saluto
Givabon

Risposte
Lo_zio_Tom
Hai fatto tutto correttamente. Ciò che hai calcolato, ovvero

$S(z)=P(Z>z)=P(X_(1)>z,...,X_(10)>z)=((10-z)/10)^10$

è la funzione di sopravvivenza di $Z=min(X_(i))$,


e da qui immediatamente otteniamo la funzione di distribuzione (quella che si chiama CDF) del minimo

$F_(Z)(z)=1-((10-z)/10)^10$ con $z in [0;10]$

se vuoi calcolare la densità basta derivare la F ottenendo: $f(z)=((10-z)/10)^9$




e, come puoi controllare $int_(0)^(10)((10-z)/10)^9dz=1$

quindi tutto a posto!

A questo punto è facilissimo anche calcolare media e varianza risolvendo:

$E[Z]=int_(0)^(10)z((10-z)/10)^9dz=$ per parti $=10/11~=0.9091$

$E[Z^2]=int_(0)^(10)z^2((10-z)/10)^9dz=$ per parti $=50/33~=1.5152$

$V[Z]=E[Z^2]-E^2[Z]~=0.6887$

Ps: se scrivi le formule fra i simboli del dollaro escono anche in forma leggibile... :wink:

givabon
Grazie per le conferme! Mi mancava la definizione di funzione di sopravvivenza e mi confondevo...

Mi restano ancora dei dubbi sulla genuinità della mia supposizione iniziale, ossia che
$ P(X_(min)>z)=P(X_(1)>z,...,X_(10)>z) $
e mi chiedo se non ci sia un modo più canonico di affrontare il problema.
Inoltre ad occhio non mi sarei aspettato che la $ f(z) $ avesse quell'andamento monotono decrescente, ma che presentasse un massimo...

givabon
Partendo dal fatto che:
$ int_(0)^(2)((10-z)/10)^9dz~=0,87$

è corretto affermare che ho l'87% di probabilità che la $ X_(min)$ ricada nel raggio di 2 unità a partire dall'origine?

Ossia, come si esprime il concetto di margine di confidenza??

Grazie

Lo_zio_Tom
Pensavi che la distribuzione presentasse un massimo? Questo sì che è singolare! ! E perché?

Fai così: prendiamo 3 variabili iid uniformi discrete che assumono valori $1; 2; 3$

Prova a fare tutti i casi possibili e vedi quante volte trovi cone valore minimo 1 2 oppure 3. ..e vedi se non è logico che la distribuzione sia decrescente. .

Tutto il resto va bene


Ciao

givabon
ok ho capito bene che volevi dire! Sarà sempre il valore ammissibile più basso ad essere il più gettonato ;)
Grazie!

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.