Problema su distribuzione statistica campionaria

Fai una domanda Tutte le categorie

nanaina

3 mar 2018, 13:05

Ciao, ho il seguente problema:
Si ipotizzi per la v.c. X una distribuzione Uniforme nell'intervallo (0, $\vartheta$), calcolare media e varianza della v.c.. Avendo estratto un campione bernoulliano di n elementi determinare lo stimatore per $\vartheta$ con il metodo dei momenti e confrontarlo con lo stimatore $T_2$ = $X_((1))$ + $X_((n))$, ricavato una volta ordinato il campione in modo non decrescente.

Per la prima parte non ho problemi. Vi risparmio i calcoli e posto direttamente i risultati: $E(X) = \vartheta/2$ e $Var(X) = \vartheta^2/12$. Ho calcolato lo stimatore con il metodo dei momenti imponendo $M=\mu'$, quindi $T_1 = \hat vartheta = 2\bar X $.
$E(T_1) = \vartheta $ $rArr T_1 $ è non distorto
$MSE(T_1) = Var(T_1) = 4/n^2 * \vartheta ^ 2/12$
Ora per me c'è il problema.
Per confrontare i i 2 stimatori ho bisogno di trovare il valore atteso e MSE per $T_2$ che è a sua volta una v.c.. Conosco la pdf di $X_((1))$ e la pdf di $X_((n))$ e penso che la pdf di $T_2$ sia questa:

$f(y)={(n/\vartheta^n*y^(n-1) ,y in (0, \vartheta)),(n/\vartheta*(1-y/\vartheta)^(n-1) ,y in (\vartheta, 2\vartheta)):}$
é questa la strada giusta?
Provo a fare i calcoli per ricavare $E(T_2)$ ma non sono tanto "agevoli" e quindi mi chiedo se ho sbagliato qualcosa e se posso avere qualche suggerimento. Grazie

Risposte

Lo_zio_Tom

3 mar 2018, 12:45

"nanaina":

Provo a fare i calcoli per ricavare $E(T_2)$ ma non sono tanto "agevoli" e quindi mi chiedo se ho sbagliato qualcosa e se posso avere qualche suggerimento. Grazie

Dipende cosa intendi per "agevoli"

$E[X_((n))]=int_(0)^(theta)n/theta^nx^ndx=n/(theta^n(n+1)) [x^(n+1)]_0^theta=n/(n+1)theta$

$E[X_((1))]=int_(0)^(theta)[1-x/theta]^ndx=theta int_0^1t^ndt=theta/(n+1)$

Quindi

$E[T_2]=E[X_((1))]+E[X_((n))]=theta/(n+1)+theta n/(n+1)=theta$

Inoltre la varianza di $T_1$ è sbagliata.

$V[T_1]=4V[bar(X)]=4sigma^2/n=theta^2/(3n)$

ciao

nanaina

4 mar 2018, 11:35

P.S. non riesco a cancellare l'altro messaggio che ho postato per errore. Grazie al tuo suggerimento ho proseguito l'esercizio così:
$Var(T_(2))= Var(X_((1))) + Var(X_((n)))$
$Var(X_((n))) = E(X_((n))^2) - [E(X_((n)))]^2$
$E(X_((n))^2) = \int_0^varthetax^2*n/vartheta^n*x^(n-1)dx = \int_0^vartheta n/vartheta^n*x^(n+1)dx = n/(n+2)vartheta^2$
Quindi :
$Var(X_((n))) = n/(n+2)vartheta^2 - n^2/(n+1)^2vartheta^2 = nvartheta^2/((n+1)^2(n+2))$

Per quanto riguarda $X_((1))$:
$Var(X_((1))) = E(X_((1))^2) - [E(X_((1)))]^2$
$E(X_((1))^2) = \int_0^varthetax^2*n/vartheta*(1-x/vartheta)^(n-1)dx = n/vartheta \int_0^1 vartheta^3*(1-t)^2*t^(n-1)dx =
2vartheta^2/((n+1)(n+2))$
risolvendo per sostituzione $t=1-x/vartheta$
da cui:
$Var(X_((1)))= 2vartheta^2/((n+1)(n+2)) - vartheta^2/((n+1)^2(n+2)) =nvartheta^2/((n+1)^2(n+2))$
Quindi, se non ho sbagliato i conti, le due v.c. hanno la stessa varianza. Dipende forse dal fatto che sono costruite in modo simile?
infine:
$Var(T_(2)) = 2nvartheta^2/((n+1)^2(n+2))$.
Confronto fra $T_1$ e $T_2$
Sono entrambi non distorti. Per valutarne l'efficienza devo confrontare le varianze.
$eff(T_2/T_1)= (theta^2/(3n) )/(2nvartheta^2/((n+1)^2(n+2)))=((n+1)^2(n+2))/(6n^2) $.
Questo rapporto è sempre maggiore di 1 (l'ho provato numericamente, spero sia sufficiente altrimenti deve risolvere l'equazione di terzo grado, esatto?) quindi $T_2$ è più efficiente di $T_1$.
Anche se non è richiesto dall' esercizio, ho una domanda: l'informazione di Fisher in questo caso è pari a:
$I_n(theta) = -E(d^2/(dvartheta) (lnL))= -E (n/theta^2) = - n/theta^2$ un valore negativo??
Con $ L(vartheta) = vartheta^-n$ e $lnL = - nlnvartheta$

Lo_zio_Tom

4 mar 2018, 11:48

Non ho tempo di guardare tutti i conti ma ti dico subito che

$V[T_2]=V[X_((1))]+V[X_((n))]+2Cov[X_((1)),X_((n))]$

Una volta ordinati i valori, le $X_((i))$ non sono più indipendenti...

Quindi se, come hai trovato, $V[T_1]>V[X_((1))]+V[X_((n))]$ non puoi dire nulla....ma devi anche calcolare la covarianza.

L'informazione di Fischer non ti è richiesta perché il modello è non regolare...E quindi non sono soddisfatte le condizioni di regolarità necessarie. L'unica soluzione è quella di usare il metodo di Chapman Robbins Kiefer ma le cose si complicano notevolmente...ovviamente tutto dipende da che tipo di studi stai facendo....

L'altro messaggio lo cancello io

nanaina

4 mar 2018, 12:23

Ok grazie. Ora calcolo anche la covarianza. Sono ingegnere e volevo studiare alcuni concetti di statistica per il mio lavoro. Sto studiando sul Piccolo che è molto teorici. Grazie mille ancora.

Lo_zio_Tom

4 mar 2018, 12:29

Ottimo! Pure io non sono uno studente, e nemmeno un prof.

Allora, fra dilettanti della materia, ti propongo un approfondimento, secondo me molto interessante (anche se non ho provato a farlo)

Qual è la distribuzione esatta di $T_2$?

In questo topic spiego come fare....prima calcoli la distribuzione congiunta trattando il minimo e il massimo come statistihe d'ordine e poi calcoli la trasformazione $Z=X+Y$

nanaina

4 mar 2018, 13:06

Ci provo

Lo_zio_Tom

4 mar 2018, 16:18

Giusto per sapere se ti trovi, a me viene così:

Indicando $X=X_((1))$ e $Y=X_((n))$ la densità congiunta mi viene

$f(x,y)=(n(n-1))/theta^2[(y-x)/theta]^(n-2)I_((x;theta])(y)$

Con $n>=2$

per calcolare la distribuzione della somma $Z=X+Y$ occorre quindi integrare

$int int_(X+Y<=z)f(x,y)dxdy$

sul triangolo sopra la bisettrice all'interno del rettangolo $[0;theta]xx[0;theta]$

E' dunque necessario dividere la variabile $Z in [0;2theta]$ in due parti

Per $z in [0,theta]$ abbiamo

$F_Z=int_0^(z/2)dxint_x^(z-x)f(x,y)dy$

da risolvere....

per quanto riguarda la seconda parte del dominio si può fare uno meno l'integrale doppio della densità sul triangolino residuo...

insomma il concetto è questo, il resto son solo conti....

Ciao

Rispondi

Per rispondere a questa discussione devi prima effettuare il login.

Problema su distribuzione statistica campionaria

Segnala Post di