[RISOLTO] Svolgimento passaggi con funzione indicatrice (e produttoria)

alessandromagno08
Ciao a tutti,

ho un campione casuale semplice $y=(y_1,...,y_n)^T$ da una variabile casuale Uniforme $(0,theta)$, $theta$ >0.

La funzione di densità relativa ad una singola osservazione $y_i$ vale:

$1/theta$ per $y_i in (0,theta)$.

Domanda nr. 1: $1/theta$ perché sarebbe stato $1/(theta-0)$, cioè al denominatore la differenza tra gli estremi dell'intervallo, giusto?

La funzione di densità vista prima si potrebbe scrivere anche così:

$1/theta I_(0,theta) (y_i)$.

Domanda nr. 2: questo perché se $y_i$ si trova all'interno dell'intervallo $(0,theta)$ vale $1/theta 1$, altrimenti vale $1/theta 0$ e cioè $0$, giusto?

La funzione di verosimiglianza corrisponde a:

$L(theta) = c \prod_{i=1}^n 1/theta I_(0,theta) (y_i)$.

Domanda nr. 3: come avviene che

$L(theta) = c/theta^n \prod_{i=1}^n I_(0,1) (y_i/theta)$ ?

Posso capire che il prodotto di $1/theta$ per $n$ volte dia $1/theta^n$ (e lo porto fuori dalla produttoria), ma ciò che segue, che appare dopo il simbolo di produttoria?


Avrei successivamente altri passaggi da chiarire, ma spero che se mi darete una mano nel capire questi, probabilmente riuscirò a capirli in autonomia. Grazie!

Risposte
Lo_zio_Tom
penso di aver capito il nocciolo della questione (anche perché guardo più in là rispetto alle domande poste). Quindi invece di rispondere punto per punto alle domande ti faccio una breve ma chiara spiegazione che dovrebbe portarti a risolvere i dubbi postati ed anche altri....

Il tuo problema è quello di scrivere la verosimiglianza in funzione del parametro...e non in funzione dei dati.

La funzione di verosimiglianza, per definzione, è il prodotto delle densità, e quindi ti viene

$L(theta)=1/theta^n$

Il problema qui però è che il dominio dipende dal parametro e quindi quella cosa non è vera au tutto $RR^+$

ora osserva che, per ipotesi, hai che ogni elemento del campione è compreso fra zero e $theta$ ovvero

$0
$0
$0
in definitiva hai che $theta>y_((n))$

dove con $y_((n))$ intendo l'ennesima statistica d'ordine, cioè il max delle osservazioni.

A questo punto sei in grado di scriver per bene la verosimiglianza del campione in funzione del parametro

$L(theta)=1/theta^nmathbb{1}_((y_((n));+oo))(theta)$

Facciamo un passo in avanti...

1) qual è lo stimatore di max verosimiglianza di $theta$?? se vedi bene la verosimiglianza è funzione strettamente decrescente al crescere di $theta$ .... e quindi il punto di massimo (anzi l'arg sup, per essere precisi) è il punto di frontiera $hat(theta)_(ML)=max(y)$

E ciò si vede anche dal grafico

(click per ingrandire)


2) qual è lo stimatore sufficiente per $theta$? ... sempre lui, il $max(y)$; infatti applicando il teorema di fattorizzazione vedi che nella tua $L(theta)$ hai una funzione che dipende sia da $theta$ che dai dati $y_i$ MA tale funzione dipende dai dati SOLO attraverso una funzione: il massimo delle osservazioni e dunque quello è lo stimatore sufficiente.

ho fatto qualche passo in avanti rispetto alla tua richiesta ma se capisci bene la mia risposta ti risparmierai un sacco di guai

....e se volessimo trovare un intervallo di confidenza per $theta$??

...e se volessimo vedere se tale stimatore oltre che sufficiente è anche completo??

....alle prossime puntate

ciao ciao

alessandromagno08
"tommik":
penso di aver capito il nocciolo della questione (anche perché guardo più in là rispetto alle domande poste). Quindi invece di rispondere punto per punto alle domande ti faccio una breve ma chiara spiegazione che dovrebbe portarti a risolvere i dubbi postati ed anche altri....


Ottimo, insperabile, guardare più in là rispetto alle mie domande, troppa grazia, però nel mio caso ho sì bisogno di un aiuto passo-passo, altrimenti se non capisco anche le parti che altri danno per scontato non riuscirò a capire i problemi più grandi :oops:

Scusami quindi se torno alle mie domande. Avrei bisogno di una conferma alle domande nr. 1 e nr. 2.

"tommik":
Il tuo problema è quello di scrivere la verosimiglianza in funzione del parametro...e non in funzione dei dati.
La funzione di verosimiglianza, per definizione, è il prodotto delle densità, e quindi ti viene
$L(theta)=1/theta^n$
Il problema qui però è che il dominio dipende dal parametro e quindi quella cosa non è vera au tutto $RR^+$
ora osserva che, per ipotesi, hai che ogni elemento del campione è compreso fra zero e $theta$ ovvero
$0 $0 $0 in definitiva hai che $theta>y_((n))$
dove con $y_((n))$ intendo l'ennesima statistica d'ordine, cioè il max delle osservazioni.
A questo punto sei in grado di scriver per bene la verosimiglianza del campione in funzione del parametro
$L(theta)=1/theta^nmathbb{1}_((y_((n));+oo))(theta)$


Ok, d'accordo, così sono riuscito a capire come arrivare a $L(theta)=1/theta^nmathbb{1}_((y_((n));+oo))(theta)$. Ma riagganciandomi alla domanda nr. 3, se la verosimiglianza è in funzione del parametro, perché porta $1/theta^n$ , moltiplicato per la costante $c$, al di fuori della produttoria e poi mi rimette $1/theta$ dentro la produttoria? E perché l'intervallo è $(0,1)$ e non più $(0,theta)$? Non sembra una verosimiglianza, quella inserita nella domanda nr. 3, diversa da quella tua (molto più comprensibile)?

"tommik":

Facciamo un passo in avanti...
1) qual è lo stimatore di max verosimiglianza di $theta$?? se vedi bene la verosimiglianza è funzione strettamente decrescente al crescere di $theta$


questo perché al crescere di $theta$ la frazione $1/theta^n$ dà risultati sempre più piccoli?

"tommik":

.... e quindi il punto di massimo (anzi l'arg sup, per essere precisi) è il punto di frontiera $hat(theta)_(ML)=max(y)$
E ciò si vede anche dal grafico


Si riuscirebbe secondo te a disegnarla anche su carta, senza avere calcolatrici/computer a portata di mano?

"tommik":

2) qual è lo stimatore...


Il resto spero di riuscirlo ad approfondire più avanti, così riprenderò in mano ciò che hai scritto, grazie!!!

Lo_zio_Tom
Il grafico della funzione l'ho fatto a mano e poi l'ho disegnato manualmente con Paint di Windows...mica col compiuter...è il grafico di $y=1/x^n$....è una funzione decrescente, convessa che tende a zero quando $x rarr+oo$

per quanto riguarda i passaggi fatti dal libro sono, in termini molto tecnici, "una sega mentale". Però è utile capirli più che altro per capire l'uso delle indicatrici.

La funzione di verosimiglianza è ovviamente questa

$L(theta)=1/theta^n mathbb{1}_((0;theta))(y)$

Punto 1) la costante c serve solo a dire che la verosimiglianza è definita a meno di costanti moltipilicative (quindi metterla o non mettere la c è indifferente)

2) porta fuori correttamente $1/theta^n$ e poi scrive diversamente la funzione indicatrice[nota]nelle formule, nei pedici ci devi mettere il "punto e virgola" non solo la virgola altrimenti ti fotte le parentesi al pedice[/nota] dato che le 3 scritture qui sotto sono del tutto indifferenti

$mathbb{1}_((0;theta))(y)=mathbb{1}_((0;1))(y/theta)=mathbb{1}_((max(y);+oo))(theta)$

perché se $Y$ è uniforme su $(0;theta)$ allora la variabile $Y/theta$ è uniforme in $(0;1)$

(prova a trasformare la variabile e te ne accorgi)

In realtà ciò dovrebbe essere chiaro anche seguendo un'altra strada...la tua $f(y)$ è una distribuzione di scala e quindi la variabile $Y/theta$ è standardizzata[nota]$Y/theta$ gioca un ruolo fondamentale (anzi pivotale ahah) nella Statistica perché è una quantità che dipende da $theta$ ma la cui distribuzione è indipendente da $theta$: è quella che si chiama quantità pivotale[/nota].....cioè $Y/theta~U(0;1)$

Il testo però non ha messo la forma più utile della verosimiglianza...ovvero quella che ti ho indicato io. Se quella che ti ho scritto è chiara usa quella....vedrai che ti risolverà un sacco di problemi

Consiglio...vai avanti a studiare e vedrai che ti si chiarirà tutto molto ma molto presto

bye

alessandromagno08
"tommik":
Il grafico della funzione [cut]


Grazie infinite! :smt023

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.