Funzione indicatrice e sua produttoria
Buonasera a tutti, mi sono appena registrato su questo fantastico forum per chiedervi un po' di più sulla funzione indicatrice che spesso trovo in esercizi che richiedono il calcolo della funzione di verosimiglianza.
Spero mi perdoniate per il mio modo di parlare non proprio tecnico e per la sintassi sicuramente non corretta, oggi mi sono approcciato alla scrittura delle formule.
La prof ci ha accennato cosa fosse suddetta funzione (vale 1 se x appartiene al sottoinsieme, vale 0 altrimenti), ma non realmente nel dettaglio... quindi mi trovo non poco in difficoltà.
Proverò a spiegarmi meglio con alcuni esempi, premetto che le mie basi di matematica non sono solide anche se sto provando in tutti i modi a migliorare
Esempio 1:
$ f_X(x;θ) =2/θ(1−x/θ)I_(0,θ)(x),θ >0 $
In questo esempio per trovare la verosimiglianza viene fatta la produttoria di
$ f_n(x_n;θ) = 2^nθ^(−n)(∏_i(1−x_i/θ))∏_iI_(0,θ)(x_i)$
ed in fine
$ L(θ;x_n)=θ^(−n)(∏_i(1−x_i/θ))I_(x_[(n),+∞))(θ) $ è positiva solo per $θ > x_[(n)$
Esempio 2:
$ f_X(x;θ) = 2θ^2x^(−3)I_(θ,+∞)(x),θ >0 $
In quest' altro esempio viene fatto così
$ f_n(x_n;θ)=2^nθ^(2n)(∏_ix_i)∏_iI_(θ,+∞)(x_i) $
e poi
$ L(θ;x_n)=θ^(2n)I_(0,x_[(1))](θ) $ è positiva solo per $ θ∈(0,x_[(1)]) $
Perché in base all'intervallo della funzione dopo la produttoria cambia completamente? Quale sono le proprietà, ma soprattutto il criterio?
Mi dispiace molto per la poca chiarezza, ma davvero non ho capito questa funzione e inizio ad essere disperato, su internet poi non riesco a trovare nulla di intuitivo per me.
Grazie dell' attenzione e del tempo.
Spero mi perdoniate per il mio modo di parlare non proprio tecnico e per la sintassi sicuramente non corretta, oggi mi sono approcciato alla scrittura delle formule.
La prof ci ha accennato cosa fosse suddetta funzione (vale 1 se x appartiene al sottoinsieme, vale 0 altrimenti), ma non realmente nel dettaglio... quindi mi trovo non poco in difficoltà.
Proverò a spiegarmi meglio con alcuni esempi, premetto che le mie basi di matematica non sono solide anche se sto provando in tutti i modi a migliorare

Esempio 1:
$ f_X(x;θ) =2/θ(1−x/θ)I_(0,θ)(x),θ >0 $
In questo esempio per trovare la verosimiglianza viene fatta la produttoria di
$ f_n(x_n;θ) = 2^nθ^(−n)(∏_i(1−x_i/θ))∏_iI_(0,θ)(x_i)$
ed in fine
$ L(θ;x_n)=θ^(−n)(∏_i(1−x_i/θ))I_(x_[(n),+∞))(θ) $ è positiva solo per $θ > x_[(n)$
Esempio 2:
$ f_X(x;θ) = 2θ^2x^(−3)I_(θ,+∞)(x),θ >0 $
In quest' altro esempio viene fatto così
$ f_n(x_n;θ)=2^nθ^(2n)(∏_ix_i)∏_iI_(θ,+∞)(x_i) $
e poi
$ L(θ;x_n)=θ^(2n)I_(0,x_[(1))](θ) $ è positiva solo per $ θ∈(0,x_[(1)]) $
Perché in base all'intervallo della funzione dopo la produttoria cambia completamente? Quale sono le proprietà, ma soprattutto il criterio?
Mi dispiace molto per la poca chiarezza, ma davvero non ho capito questa funzione e inizio ad essere disperato, su internet poi non riesco a trovare nulla di intuitivo per me.
Grazie dell' attenzione e del tempo.
Risposte
Il problema è chiarissimo e quindi provo a spiegarmi con parole diverse
Prima di tutto una piccola precisazione.
Le verosimiglianze postate non sono esattamente corrette, occorre scrivere $L(\theta)prop$ e non $=$ in quanto (correttamente) sono stati trascurati tutti i termini moltiplicativi che non dipendono dal parametro.
Infatti le verosimiglianze sono equivalenti a meno di costanti moltiplicative (additive per le log-verosimiglianze)
Il fatto che il dominio della L cambi rispetto alla densità è da ricercarsi proprio nel fatto che la verosimiglianza è funzione del parametro e non più delle $x_1,...,x_n$ che, come vedi, ho scritto in minuscolo proprio perché ora sono dei semplici "dati" non più variabili.
Prendiamo ad esempio il secondo caso:
La densità è questa:
$f(x|theta)=2 theta^2 x^(-3) \mathbb{1}_{[\theta; oo)}(x)$
Prima di tutto osserviamo che $2x^(-3)$ è un fattore moltiplicativo che non dipende da $theta$ .... e quindi lo possiamo buttare nel cestino...
Per quanto riguarda il dominio vediamo che, per ogni osservazione $X_i$ vale
$\theta <= X_1
$\theta <= X_2
.....
$\theta <= X_n
Quindi è anche vero che $theta$ è minore o uguale al più piccolo $X_i=X_{(1)}$
In definitiva
$L(\theta) prop \theta^(2n) xx \mathbb{1}_{(0;x_{(1)}]}(theta)$
Passo successivo:
E' del tutto evidente che questa verosimiglianza è strettamente crescente $AA theta$ e quindi il suo argmax (anzi meglio, argsup) si troverà alla frontiera:
mentre la stima di massima verosimiglianza sarà il suo valore osservato: $x_{(1)}$
PS: la densità in questione è quella di una distribuzione nota: la Pareto
...penso che ora tu possa risolvere il primo esempio in autonomia
-------------------------------------------
Per quanto riguarda invece il mero uso della funzione indicatrice, essa serve per compattare la scrittura di una espressione matematica ed il suo uso può essere anche superfluo; a volte utile, a volte necessario (come nel caso delle verosimiglianze di densità con supporto dipendente dal parametro).
Facciamo alcuni esempi:
(1)
La densità di una variabile esponenziale negativa è questa:
$f_X(x|theta)={{: ( theta e^{-\theta x) , ;x>=0 ),( 0 , ;" altrove" ) :}$
la notazione così scritta è piuttosto scomoda, quindi si opta per la seguente
$f_X(x|theta)=theta e^{-\theta x) xx \mathbb{1}_{[0;+oo)}(x)$
che è la stessa cosa; la f(x) vale quel che vale quando x appartiene all'intervallo specificato al pedice dell'indicatrice e zero quando non lo è.
(2)
la CDF (funzione di ripartizione) di una variabile X uniforme in (0;1) è questa
$F_X(x)={{: ( 0 , ;x<0 ),( x , ;0<=x<1 ),( 1 , ;x>=1 ) :}$
...ancora più scomoda. Con l'ausilio dell'indicatrice possiamo compattare la scrittura così
$F_X(x)=x mathbb{1}_{(0;1)}(x)+mathbb{1}_{[1;+oo)}(x)$
(3)
consideriamo la seguente densità triangolare:
$f_X(x)={{: ( x , ;0<=x<1 ),( 2-x , ;1<=x<2 ),( 0 , ;" altrove" ) :}$
(sempre più scomoda)
Quindi in modo compatto
$f_X(x)=[1-|1-x|] \cdot mathbb{1}_{(0;2)}(x)$
come vedi l'uso corretto dell'indicatrice aiuta molto a compattare la scrittura
Prima di tutto una piccola precisazione.
Le verosimiglianze postate non sono esattamente corrette, occorre scrivere $L(\theta)prop$ e non $=$ in quanto (correttamente) sono stati trascurati tutti i termini moltiplicativi che non dipendono dal parametro.
Infatti le verosimiglianze sono equivalenti a meno di costanti moltiplicative (additive per le log-verosimiglianze)
Il fatto che il dominio della L cambi rispetto alla densità è da ricercarsi proprio nel fatto che la verosimiglianza è funzione del parametro e non più delle $x_1,...,x_n$ che, come vedi, ho scritto in minuscolo proprio perché ora sono dei semplici "dati" non più variabili.
Prendiamo ad esempio il secondo caso:
La densità è questa:
$f(x|theta)=2 theta^2 x^(-3) \mathbb{1}_{[\theta; oo)}(x)$
Prima di tutto osserviamo che $2x^(-3)$ è un fattore moltiplicativo che non dipende da $theta$ .... e quindi lo possiamo buttare nel cestino...
Per quanto riguarda il dominio vediamo che, per ogni osservazione $X_i$ vale
$\theta <= X_1
$\theta <= X_2
.....
$\theta <= X_n
Quindi è anche vero che $theta$ è minore o uguale al più piccolo $X_i=X_{(1)}$
In definitiva
$L(\theta) prop \theta^(2n) xx \mathbb{1}_{(0;x_{(1)}]}(theta)$
Passo successivo:
E' del tutto evidente che questa verosimiglianza è strettamente crescente $AA theta$ e quindi il suo argmax (anzi meglio, argsup) si troverà alla frontiera:
$hat(theta)_{ML}=X_{(1)}$
mentre la stima di massima verosimiglianza sarà il suo valore osservato: $x_{(1)}$
PS: la densità in questione è quella di una distribuzione nota: la Pareto
...penso che ora tu possa risolvere il primo esempio in autonomia
-------------------------------------------
Per quanto riguarda invece il mero uso della funzione indicatrice, essa serve per compattare la scrittura di una espressione matematica ed il suo uso può essere anche superfluo; a volte utile, a volte necessario (come nel caso delle verosimiglianze di densità con supporto dipendente dal parametro).
Facciamo alcuni esempi:
(1)
La densità di una variabile esponenziale negativa è questa:
$f_X(x|theta)={{: ( theta e^{-\theta x) , ;x>=0 ),( 0 , ;" altrove" ) :}$
la notazione così scritta è piuttosto scomoda, quindi si opta per la seguente
$f_X(x|theta)=theta e^{-\theta x) xx \mathbb{1}_{[0;+oo)}(x)$
che è la stessa cosa; la f(x) vale quel che vale quando x appartiene all'intervallo specificato al pedice dell'indicatrice e zero quando non lo è.
(2)
la CDF (funzione di ripartizione) di una variabile X uniforme in (0;1) è questa
$F_X(x)={{: ( 0 , ;x<0 ),( x , ;0<=x<1 ),( 1 , ;x>=1 ) :}$
...ancora più scomoda. Con l'ausilio dell'indicatrice possiamo compattare la scrittura così
$F_X(x)=x mathbb{1}_{(0;1)}(x)+mathbb{1}_{[1;+oo)}(x)$
(3)
consideriamo la seguente densità triangolare:
$f_X(x)={{: ( x , ;0<=x<1 ),( 2-x , ;1<=x<2 ),( 0 , ;" altrove" ) :}$
(sempre più scomoda)
Quindi in modo compatto
$f_X(x)=[1-|1-x|] \cdot mathbb{1}_{(0;2)}(x)$
come vedi l'uso corretto dell'indicatrice aiuta molto a compattare la scrittura
Gentilissimo tommik, già da un'occhiata veloce mi sembra tutto più chiaro. A breve svolgerò il primo esercizio, ma ripeto sono sicuro di aver capito (abbastanza) su come gestire questa funzione 
Non puoi immaginare quanto ti sia grato. Ti auguro una buona giornata, grazie!!!
-------------------
Sono riuscito a svolgere il tutto, finalmente adesso ha tutto più senso. Grazie ancora!

Non puoi immaginare quanto ti sia grato. Ti auguro una buona giornata, grazie!!!

-------------------
Sono riuscito a svolgere il tutto, finalmente adesso ha tutto più senso. Grazie ancora!