Stimatore del parametro b di un campione uniforme in (0,b)

submarine1
Buonasera Forum. Ho un dubbio sul calcolare le prestazioni di uno stimatore. L'esercizio chiede:

Dato un campione aleatorio di cardinalità N estratto da una popolazione uniforme U(0,b) analizzare le prestazioni del seguente stimatore del parametro b:

$\hatb = 2/N sum_{n=0}^(N-1) Y(n)$

e stabilire se sia o meno consistente.

Per prestazioni si intendono la polarizzazione e la varianza dello stimatore.

1. Prima di calcolare la polarizzazione è necessario conoscere la pdf di $\hatb$ per effettuare la media statistica.
A questo punto ho utilizzato la funzione caratteristica che fattorizza le singole CF per ciascuna variabile aleatoria se queste sono iid.

Quindi ho calcolato la CF di $\hatb$ come prodotto di N CF delle singole variabili aleatorie e l'ho calcolata in $2u/N$:

$\phi_\hatb(u) = \phi_S(2u/N)$, dove $S = sum_{n=0}^(N-1)Y(n)$

$\phi_\hatb(u) = [(e^(j2/Nub) -1)/(j2/Nub)]^N$

Ora la media si ricava come cumulante di ordine uno, e per fare ciò si applica la definizione:

$k_m(X) -= [-j]^m d^m/du^m \phi_X(u)$ con $u=0$

Quindi per la media:

$k_1 = E[\hatb]$

Non ho scritto il risultato perchè cade in una forma indeterminata. Quindi vi chiedo cortesemente un contributo e una curiosità: sarebbe troppo laborioso ragionare direttamente in termini di pdf?

P.S. Risolto questo varianza e di conseguenza consistenza vengono naturali, spero.

Grazie a tutti.

Risposte
Lo_zio_Tom
per calcolare media e varianza dello stimatore non sempre serve cercare tutta la distribuzione, in questo caso bastano le proprietà di media e varianza.

Ogni elemento del campione ha la stessa distribuzione della popolazione e gli elementi sono fra loro indipendenti.

Ergo, la media della somma è la somma delle medie mentre la varianza della somma è la somma delle varianze.

Noto inoltre che $V(aX)=a^2V(X)$ il problema si risolve in modo banale.

Un esempio recente dove invece è necessario calcolare preventivamente la legge dello stimatore è questo

PS: che significa $sum_(n=0)^(N-1) Y(n)$ ??

sai che mettere un $(n)$ fra parentesi significa "ordinare i dati in modo crescente"?
Com'è fatto il campione di cardinalità N?

$Y_1,...,Y_N$ oppure $Y_0,...,Y_(N-1)$?

ghira1
"tommik":

sai che mettere un $(n)$ fra parentesi significa "ordinare i dati in modo crescente"?

Questo non lo sapevo io.

Lo_zio_Tom
dato il campione

$X_1,...,X_n$ per indicare le statistiche d'ordine, cioè le variabili ordinate si scrive

$X_((1)),...,X_((n))$

infatti per indicare il minimo si scrive $X_((1))$ mentre il massimo $X_((n))$

vedi ad esempio qui

oppure qui per un bell'esercizio risolto sul forum

Nell'esercizio del link l'utente mette l'indice come apice invece di pedice, ma è una notazione che non ho mai visto prima.

ghira1
"tommik":
le variabili ordinate si scrive

$X_((1)),...,X_((n))$


Ah, nei suffissi! A questo punto non sono sicuro se l'ho visto o no, ma sembra una convenzione utile. Grazie di avermelo detto (o forse ricordato?).

L'OP ha scritto $Y(n)$ che mi sembrava considerare $Y$ come funzione di $n$. Il che va.. bene, no? E avere $n$ che varia da 0 a $N-1$ o da 1 a $N$ mi sembra una questione di gusto.

Lo_zio_Tom
"ghira":
E avere $n$ che varia da 0 a $N-1$ o da 1 a $N$ mi sembra una questione di gusto.



beh insomma.... se il campione è questo

$Y_1,...,Y_N$ e lo stimatore è questo


$T=2/N sum_(n=0)^(N-1)Y_n$ (senza parentesi :wink: ) la sua media è

$E(T)=(2(N-1))/N b/2=(N-1)/N b$

se invece il campione è questo $Y_0,...,Y_(N-1)$ allora la sua media è $b$

In entrambi i casi lo stimatore è asintoticamente corretto ma nel secondo caso è distorto.

Non sei d'accordo?

ghira1
"tommik":

Non sei d'accordo?


Sì sono d'accordo. L'OP .. sembra parlare solo di $0\ldotsN-1$ ma forse mi sbaglio. Se il campione e il calcolo sono coerenti non vedo problemi. Magari usare $1\ldotsN$ è più comune.

submarine1
Grazie Tommik. Era una banalità che dalla portata dell'esercizio si poteva intuire. Comunque nel corso siamo abituato a intendere con $Y(n)$ l'elemente n-esimo del campione di dimensione N. Inoltre il campione per convenzione lo si intende da 0 a N-1.

Grazie ancora.

Lo_zio_Tom
Insomma 'sto stimatore è non distorto, è consistente....anzi ti dirò di più....applicand la legge forte dei grandi numeri abbiamo che $T\stackrel("q.c.")rarr b$, cioè al crescer di $n$

$mathbb{P}[lim_n T_n=b]=1$






allora è un buon stimatore per il parametro b?

submarine1
$ mathbb{P}[lim_n T_n=b]=1 $ come la colleghi questa alle prestazioni asintotiche?

Comunque tornando al nostro stimatore non è polarizzato e consistente ma è ben lontano dall'essere efficiente, almeno un ordine di grandezza. Calcolando il CRLB di $\hatb$ si ha infatti:

$J_F(b) = N^2/b^2$ , quindi:

$Var[\hatb] = b^2/(6N) >= b^2/N^2$


Era questo che volevi sapere?

Lo_zio_Tom
"submarine":
$ mathbb{P}[lim_n T_n=b]=1 $ come la colleghi questa alle prestazioni asintotiche?



questo significa che lo stimatore che uso per sapere quanto vale $b$ è QUASI CERTAMENTE UGUALE a b....direi che è più di un ottimo risultato asintotico....

In realtà non volevo sapere nulla...il limite inferiore di CR è solo una cosa molto molto teorica, raramente viene raggiunto anche dallo stimatore più efficiente.

Tra l'altro nel modello in esame tale limite non è così facilemente calcolabile, dato che il modello non è regolare.

Per trovare un buon stimatore occorre trovare lo stimatore sufficiente del modello...e da lì partire, vedere se tale stimatore c'è, se è anche completo ecc ecc

Qui ho messo un ottimo tutorial su come trovare gli UMVUE

Qui invece trovi un'idea di come calcolare il CRLB per un modello uniforme

Ps: da quanto ho capito il tuo non è un esame di Statistica ma, immagino, di Teoria dell'Informazione...non starei a crucciarmi tanto su questioni inferenziali....

submarine1
Ok allora mi stai dicendo che devo fare attenzione ogni volta alla regolarità della distribuzione altrimenti calcolo un limite che non ha senso. Quindi in questo Cramer-Rao non è applicabile perchè il modello non è regolare?

Il corso è sulla stima e la rivelazione di segnali aleatori.

Lo_zio_Tom
Le condizioni di regolarità le dovresti conoscere bene e comunque le trovi su tutti i testi. Sono condizioni molto molto generali di derivazione sotto il segno di integrale e valgono "pressoché" sempre. Non si chiede mai di verificarle.

C'è però un caso "classico" in cui tali condizioni non sono verificate: quando il dominio dipende dal parametro, come appunto nel caso della tua uniforme $U(0;theta)$

Anche per lo stimatore di MV non puoi derivare la logverosimiglianza ma devi ragionare sul dominio del parametro.....

submarine1
Grazie ancora per il tuo aiuto.

ghira1
Il nostro stimatore ha un problema. Può essere palesemente assurdo.

Per esempio se i valori sono $1$,$2$,$3$,$4$,$100$ due volte la media è minore del nostro valore maggiore. Sappiamo, ovviamente, che $b$ deve essere _almeno_ grande quanto il valore maggiore nel campione.

Cosa dici, come stimatori, di:

$Y_{(N-1)}$ e $\frac{N+1}{N}Y_{(N-1)}$?

($Y_{(N-1)}$ è il valore maggiore nel campione - usando la notazione/convenzione segnalata da tommik prima)

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.