Massimi e minimi relativi o assoluti della f: R^n-->R

isaac888
Salve a tutti... Durante l'esame di Calcolo mi sono incartato nel soddisfare la succitata richiesta con la seguente funzione:

$\f : \mathbb{R}^n\rightarrow\mathbb{R}$, tale che:

$\f(x_1,x_2,...,x_n)=x_1*x_2*...*x_n*e^(-x_1^2-2^2*x_2^2-...-n^2*x^2)$ che riscritta meglio è:

$\f(bar{x})=(\prod_{i=1}^n x_i)*(e^(-\sum_{i=1}^n i^2*x_i^2))$, (a occhio noto che è $\C^infty(\mathbb{R^n})$)

Mi calcolo la derivata e ottengo:

$\frac{\partialf(bar{x})}{\partialx_i}=(\prod_{h\nei}^n x_h)*(1-2i^2x_i^2)*(e^(-\sum_{i=1}^n i^2*x_i^2))$

allora i punti che annullano il gradiente sono $\foralli$, $\x_i=\pm\frac{1}{isqrt{2}}$ $ \vee$ $\x_i=0$

Oss1: Se $\x_h=0$ allora Esiste un'equazione (al variare di $\i$) che necessiterà dell'esistenza di un indice $\k\neh$ t.c. $\x_k=0$ per poter essere risolta. Questo implica che se una coordinata di un punto stazionario è nulla ce n'è almeno un'altra uguale a lei!

Oss2: Se $\nexists j | x_j=0$ implica che l'unico punto stazionario restante (a meno di segni) è :

$\P_1=(\pm\frac{1}{sqrt{2}},\pm\frac{1}{2sqrt{2}},...,\pm\frac{1}{nsqrt{2}})$

quindi i punti stazionari della funzione sono:

$\{P_1=(\pm\frac{1}{sqrt{2}},\pm\frac{1}{2sqrt{2}},...,\pm\frac{1}{nsqrt{2}}), P_2=(x_1,...,x_(h-1),0,x_(h+1),...,x_(k-1),0,x_(k+1),...,x_n)}, \forallj\nek \in{1,2...,n}$

Ora mi costruisco la matrice Hessiana:

(1) $\frac{\partial^2f(bar{x})}{\partial^2x_i}=(\prod_{h\nei}^n x_h)*(2i^2(e^(-\sum_{i=1}^n i^2x_i^2))*(2i^2x_i^2-3))=m_(i,i)$, $\foralli \in{1,2...,n}$
(2) $\frac{\partial^2f(bar{x})}{\partialx_ix_k}=(1-2i^2x_i^2)*(1-2k^2x_k^2)*(\prod_{h\nei,k \andi\nek}^n x_h)*(e^(-\sum_{i=1}^n i^2x_i^2))=m_(i,k)$, $\foralli,k \in{1,2...,n}$ t.c $\i\nek$, ($=\frac{\partial^2f(bar{x})}{\partialx_kx_i}=m_(k,i)$ per il Teorema di Schwartz) dove $\(m_(i,j))=M_f(bar{x})$ è l'Hessaina;

Se il punto stazionario è di tipo $\P_1$ la (2) si annulla $\foralli,k | i\nek$ allora la matrice M è diagonale, in più è verificata l'uguaglianza $\i^2x^2=frac{1}{2}$ che mi permette di dire:

$\prod_{h\nei}^n x_h=...=Sgn(\prod_{h\nei}^n x_h)\frac{i}{n!(sqrt{2})^(n-1)}$ ed inoltre $\e^(-\sum_{i=1}^n i^2x_i^2)=...=e^(-\frac{n}{2})$, (risparmio i conti) allora la (2) diventa:

(2a) $\-i^2Sgn(\prod_{i=1}^n x_i)*(frac{4e^(-frac{n}{2})}{n!(\sqrt{2})^n});$

Se $\v \in \mathbb{R^n} | v\ne0$, segue che *$\mathbf{v}\cdot\mathbf{M_f}(P_1)\cdot\mathbf{v}>0$ se e solo se (risparmio un pò di conti) $\Sgn(\prod_{i=1}^n x_i)<0$, (con lo * indico la trasposizione perchè non so texarla).

Ciò (cioè $\M_f(P_1)$ definita positiva) accade solo per un numero dispari di coordinate negative di $\P_1$, allora $\P_1$ è di minimo relativo;
In alternativa, $\P_1$ sarà di massimo relativo perchè l'Hessiana non si annulla mai!

Se il punto stazionario è del tipo $\P_2$ si nota subito che la (1) calcolata qui è nulla $\foralli$; (diagonale principale completamente nulla)
La (2) invece diventa calcolata in $\P_2$:
$\frac{\partial^2f(bar{x})}{\partialx_ix_k}=(e^(-\sum_{h\nei \andi\nek}^n h^2x_h^2))*(\prod_{h\nek\andk\nei}^n x_h)*(1-2k^2x_k^2-2i^2x_i^2+4i^2k^2x_i^2x_k^2)=(e^(-\sum_{h\nei\andi\nek}^n h^2x_h^2))*((\prod_{h\nek\andk\nei}^n x_h)-2k^2x_k(\prod_{h\nei}^n x_h)-2i^2x_i(\prod_{h\nek}^n x_h)+4i^2k^2x_ix_k(\prod_{i=1}^n x_i)=$ $\=(e^(-\sum_{h\nei\andi\nek}^n h^2x_h^2))*((\prod_{h\nek\andk\nei}^n x_h)-2k^2x_k(\prod_{h\nei}^n x_h)-2i^2x_i(\prod_{h\nek}^n x_h));

Allora si nota facilmente che $\forallh|x_{h\nek,i}=0$ allora $\frac{\partial^2f(P_2)}{\partialx_ix_k}=0$, $\foralli,k|i\nek$;
Si nota anche che si ha esattamente il contrario, cioè $\frac{\partial^2f(P_2)}{\partialx_ix_k}\ne0$, $\foralli,k|i\nek$, se e solo se $\x_i=x_k=0$;

Questo significa che la matrice hessiana è una matrice nulla a meno di due elementi in posizione (i,k), (k,i) uguali fra loro messi in posizione simmetrica rispetto alla diagonale che sono il valore di $\frac{\partial^2f(P_2)}{\partialx_ix_k}$.
Con lo stesso procedimento di prima si vede che la matrice è definita positiva se e solo se $\(\prod_{h\nek\andk\nei}^n x_h)>0$ se e solo se $\P_2$ ha al massimo 2 coordinate nulle e tutte le altre libere tali che $\Sgn(\prod_{h\nek\andk\nei}^n x_h)>0$, allora $\P_2$ di minimo relativo, mentre invece per $\Sgn(\prod_{h\nek\andk\nei}^n x_h)<0$, allora $\P_2$ di massimo relativo...

Ma quando ho almeno 3 coordinate nulle nel punto stazionario che non riesco a dire un tubo sulla matrice che succede????
Io ho provato a vedere se impongo che $\P_2$ abbia almeno 3 coord nulle ($\x_i=x_k=x_t=0$) ed $\bar{\epsilon} \in \mathbb{R^n}$ con tutte le coord uguali a $\epsilon>0$ t.c. $||bar{\epsilon}||>0 $ e prendo $\bar{x}\in P_2+\bar{\epsilon}$ e sapendo che f è continua e $\C^infty$ in tutto $\mathbb{R^n}$ vedo che fa (3) $\Sgn(f(\bar{x})-f(P_2))$ ma svolgendo i conti ottengo:

(3) è positivo se e solo se $(\prod_{h\nei,k,t \and i\nek, i\net, k\net}^n (x_h+\epsilon))>0$ che non funziona per qualunque scelta di tutte le coordinate di $\P_2$ e quindi non posso dire niente.....

Scusatemi tantissimo la lunghezza... Si poteva fare più facilmente??è giusto come ho fatto io??mi piacerebbe vedere altre soluzioni più intelligenti!! GRAZIE 1000 in anticipo già per la pazienza a chi mi risp!!!

Risposte
ciampax
Ma la funzione non la puoi scrivere più semplicemente così:

$f(x_1,\ldots,x_n)=\prod_{k=1}^n (x_k\ e^{-k^2 x_k^2})$ ??

Credo che i calcoli divengano molto più brevi: ad esempio

$\frac{\partial f}{\partial x_j}=\frac{f(x)}{x_j\ e^{-j x_j^2}}\cdot e^{-j x_j^2}(1-2j^2\ x_j^2)=\frac{f(x)}{x_j}\cdot(1-2j^2\ x_j^2)$

gugo82
Posso buttare lì un'idea?

La funzione è dispari in ogni variabile, quindi basta studiarla nel primo $2^n$-ante chiuso di $RR^n$, ossia in $([0,+oo[)^n$ e poi simmetrizzare adeguatamente il risultato ottenuto.

Per ogni fissati $x_2,\ldots ,x_n>0$, la funzione della sola $x_1$:

$phi_1(x_1)=x_1"e"^(-x_1^2)*\prod_(i=2)^(n) x_i*"e"^(-i^2x_i^2)$

ha massimo in $x_1=1/\sqrt(2)$ e tale massimo vale esattamente $1/(\sqrt(2"e"))*\prod_(i=2)^(n) x_i*"e"^(-i^2x_i^2)$.
Poniamo:

$f_2(x_2,\ldots ,x_n):=1/(\sqrt(2"e"))*\prod_(i=2)^(n) x_i*"e"^(-i^2x_i^2)\quad $,

cosicché $f_2$ è la funzione che descrive i massimi assoluti di $f$ rispetto alla prima variabile, e, fissati $x_3,\ldots ,x_n>0$, consideriamo la funzione della sola $x_2$:

$phi_2(x_2)=1/(\sqrt(2"e"))x_2"e"^(-2^2x_2^2)*\prod_(i=3)^(n) x_i*"e"^(-i^2x_i^2) \quad$;

evidentemente essa ha un solo massimo assoluto in $1/(\sqrt(2)2)$ e tale massimo vale esattamente $1/(\sqrt(2"e"))*1/(\sqrt(2"e")2)*\prod_(i=3)^(n) x_i*"e"^(-i^2x_i^2)$.
Procediamo induttivamente.
Al passo $k$ ($=1,\ldots ,n-1$) poniamo:

$f_(k+1)(x_(k+1),\ldots ,x_n):=1/((2"e")^(k/2) k!)*\prod_(i=k+1)^(n) x_i*"e"^(-i^2x_i^2) \quad$

di modo che $f_(k+1)$ è la funzione che descrive i massimi assoluti di $f$ rispetto alle prime $k$ variabili e, per fissati $x_(k+2),\ldots, x_n$ (non c'è bisogno di fissare alcunché se $k=n-1$), consideriamo la funzione della sola $x_(k+1)$:

$phi_(k+1)(x_(k+1)):=1/((2"e")^(k/2) k!)*x_(k+1)"e"^(-(k+1)^2x_(k+1)^2)*\prod_(i=k+2)^(n) x_i*"e"^(-i^2x_i^2) \quad$ (oppure $phi_n(x_n):=1/((2"e")^((n-1)/2) (n-1)!)*x_n"e"^(-n^2x_n^2)$ se $k=n-1$)

Tale funzione ha un massimo assoluto in $1/(\sqrt(2) (k+1))$ e tale massimo vale $1/((2"e")^((k+1)/2) (k+1)!)$...

Visto che le variabili sono in numero finito, il procedimento termina in un numero finito di passi e ti determina il massimo assoluto di $f$ che è in corrispondenza del punto di coordinate $(1/(\sqrt(2)),1/(2\sqrt(2)),\ldots ,1/(n\sqrt(2)))$ e vale evidentemente $1/((2"e")^(n/2) n!)$.

Come si è già notato, la funzione è dispari in ognuna delle sue variabili: quindi si può senz'altro dire che tutti i $2^n$ punti che si ottengono cambiando i segni di qualsivoglia numero di coordinate del punto $(1/(\sqrt(2)),1/(2\sqrt(2)),\ldots ,1/(n\sqrt(2)))$ (ad esempio $(-1/(\sqrt(2)),-1/(2\sqrt(2)),\ldots ,-1/(n\sqrt(2)))$ oppure $(-1/(\sqrt(2)),1/(2\sqrt(2)),-1/(3\sqrt(2))\ldots ,(-1)^n/(n\sqrt(2)))$ etc...) sono estremi per $f$; anzi si può dire che uno di tali punti è massimo [risp. minimo] se e solo se il prodotto delle sue $n$ coordinate è positivo [risp. negativo].
Inoltre il massimo ed il minimo assoluti di $f$ valgono, rispettivamente, $1/((2"e")^(n/2) n!)$ e $-1/((2"e")^(n/2) n!)$.

Infine, il punto critico "sfigato" $(0,\ldots ,0)$ è un punto di sella.

isaac888
capisco che per la soluzione che ha postato Gugo l'hessiana non serva calcolarla, perciò la domanda che sto per fare c'entra poco con la sua soluzione (devo dire veramente bella e magistrale.... complimenti davvero!!), ma avendo usato io il metodo canonico di ricerca dei max e min vorrei sapere se sarei mai potuto uscirne vivo in qualche modo (anche disperato :P ) dalla situazione in cui mi sono bloccato!

E poi la sua soluzione mi fa pensare che mi sono infognato nella casistica e in particolare ho studiato casi che non davano informazioni utili alla soluzione... tipo
quelli che io chiamo i punti del tipo $\P_2$, (cioè quelli dove compaiono zeri nelle coordinate).

Ma poi, di che tipo erano questi punti? erano massimi?minimi? boh???

E poi non so chi a parte Gugo ha fatto un pò di conti... ma io ho fatto un mucchio di conti.... non so se per un esame di 2 ore e tre quarti (c'erano altri 2 esercizi) una cosa del genere "si fa"... (scusate lo sfogo :P )


Ps: grazie 1000 ragazzi a entrambi per la disponibilità!!!

gugo82
Secondo me quelli sono altri punti critici "sfigati", come $(0,\ldots ,0)$.
Se c'è qualche zero tra le coordinate del tuo punto (ossia se stai su qualche iperpiano coordinato), la funzione si annulla e si vede che quei punti lì non possono essere né di minimo né di massimo.

Visto che hai moltissime possibilità di combinazioni (tra zeri e segni) secondo me risolvere coi metodi standard era troppo lungo e laborioso.
Ora mi è venuta in mente un'altra strada:

Facendo la trasformazione di coordinate:

(*) $\quad \{(y_1=x_1),(y_2=2x_2),(\ldots),(y_n=ny_n):}$

la tua funzione diventa:

$phi(y_1,\ldots ,y_n):=1/(n!)*\prod_(i=1)^ny_i"e"^(-y_i^2) \quad$.

Se ti restringi al $2^n$-ante positivo $([0,+oo[)^n$, la $phi$ ha massimo assoluto dove è massimo ogni fattore (ossia ogni applicazione $phi_i(y_i):=y_i"e"^(-y_i^2)$) cioè in $(1/\sqrt(2),\ldots ,1/\sqrt(2))$; inoltre vista la disparità di $phi$, sono estremali per $phi$ tutti quei punti che si ottengono da $(1/\sqrt(2),\ldots ,1/\sqrt(2))$ cambiando i segni di qualche coordinata e, tra questi, sono massimi assoluti [risp. minimi] quelli che hanno il prodotto delle coordinate positivo [negativo].

Gli estremanti di $f$ si ottengono facendo la sostituzione inversa di (*).

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.