Convessità funzione?
Ciao, amici! Studiando la proiezione di una funzione $f$ su uno spazio \(\langle 1,x,...,x^{n-1} \rangle \)mi imbatto nella funzione
\[(c_1,...,c_n)\mapsto \int_{0}^{1} \left(\sum_{i=1}^{n} c_i x^{i-1} -f(x)\right)^2 \text{d}x\].
Nel punto critico dove il suo gradiente nelle variabili $(c_1,...,c_n)$ si annulla direi che si abbia un minimo e sospetto che questo possa essere garantito dalla convessità della funzione... Qualcuno potrebbe confermare o smentire?
$+oo$ grazie a tutti!!!
\[(c_1,...,c_n)\mapsto \int_{0}^{1} \left(\sum_{i=1}^{n} c_i x^{i-1} -f(x)\right)^2 \text{d}x\].
Nel punto critico dove il suo gradiente nelle variabili $(c_1,...,c_n)$ si annulla direi che si abbia un minimo e sospetto che questo possa essere garantito dalla convessità della funzione... Qualcuno potrebbe confermare o smentire?
$+oo$ grazie a tutti!!!
Risposte
La tua funzione è una norma \(L^2\) al quadrato:
\[
\phi(c_1,\ldots ,c_n) := \left\| \sum_{k=1}^n c_k\ \mathbf{v}_k - f\right\|_2^2\; ,
\]
quindi la convessità in \((c_1,\ldots ,c_n)\) è assicurata dalla convessità e la monotonia del quadrato e dalla convessità della norma \(L^2\).
In particolare, se \((d_1,\ldots, d_n)\) è una seconda $n$-upla e \(\lambda \in [0,1]\), si ha:
\[
\begin{split}
\phi (\lambda c_1+(1-\lambda)d_1,\ldots ,\lambda c_n+(1-\lambda)d_n) &= \left\| \sum_{k=1}^n (\lambda c_k+(1-\lambda)d_k)\ \mathbf{v}_k - \lambda f - (1-\lambda)f\right\|_2^2\\
&= \left\| \lambda \left(\sum_{k=1}^n c_k\ \mathbf{v}_k - f\right) + (1-\lambda) \left( \sum_{k=1}^n d_k\ \mathbf{v}_k - f\right)\right\|_2^2\\
&\leq \left( \lambda \left\| \sum_{k=1}^n c_k\ \mathbf{v}_k - f\right\|_2 +(1-\lambda ) \left\| \sum_{k=1}^n d_k\ \mathbf{v}_k - f\right\|_2\right)^2\\
&\leq \lambda \phi (c_1,\ldots ,c_n) +(1-\lambda) \phi (d_1,\ldots ,d_n)\; .
\end{split}
\]
In generale, se hai una funzione crescente e convessa \(\Phi :[0,+\infty[ \to \mathbb{R}\) ed una norma \(\| \cdot\|:V\to [0,+\infty[\), un'applicazione \(\phi :V\to \mathbb{R}\) del tipo:
\[
\phi (\mathbf{u}) := \Phi (\|\mathbf{u}\|)
\]
è convessa in \(V\).
\[
\phi(c_1,\ldots ,c_n) := \left\| \sum_{k=1}^n c_k\ \mathbf{v}_k - f\right\|_2^2\; ,
\]
quindi la convessità in \((c_1,\ldots ,c_n)\) è assicurata dalla convessità e la monotonia del quadrato e dalla convessità della norma \(L^2\).
In particolare, se \((d_1,\ldots, d_n)\) è una seconda $n$-upla e \(\lambda \in [0,1]\), si ha:
\[
\begin{split}
\phi (\lambda c_1+(1-\lambda)d_1,\ldots ,\lambda c_n+(1-\lambda)d_n) &= \left\| \sum_{k=1}^n (\lambda c_k+(1-\lambda)d_k)\ \mathbf{v}_k - \lambda f - (1-\lambda)f\right\|_2^2\\
&= \left\| \lambda \left(\sum_{k=1}^n c_k\ \mathbf{v}_k - f\right) + (1-\lambda) \left( \sum_{k=1}^n d_k\ \mathbf{v}_k - f\right)\right\|_2^2\\
&\leq \left( \lambda \left\| \sum_{k=1}^n c_k\ \mathbf{v}_k - f\right\|_2 +(1-\lambda ) \left\| \sum_{k=1}^n d_k\ \mathbf{v}_k - f\right\|_2\right)^2\\
&\leq \lambda \phi (c_1,\ldots ,c_n) +(1-\lambda) \phi (d_1,\ldots ,d_n)\; .
\end{split}
\]
In generale, se hai una funzione crescente e convessa \(\Phi :[0,+\infty[ \to \mathbb{R}\) ed una norma \(\| \cdot\|:V\to [0,+\infty[\), un'applicazione \(\phi :V\to \mathbb{R}\) del tipo:
\[
\phi (\mathbf{u}) := \Phi (\|\mathbf{u}\|)
\]
è convessa in \(V\).
Questo è il problema dell'approssimazione ai minimi quadrati, vero? La trattazione varia molto a seconda del testo che usi. I testi di analisi numerica tendono ad essere troppo trafficoni, quelli di analisi funzionale troppo astratti, bisognerebbe estrarre il meglio dei due punti di vista.
Grazie di cuore, Gugo, per la spiegazione illuminante e dettagliata e a Dissonance per l'intervento!!!!!
Sì, sì, si tratta di un'approssimazione ai minimi quadrati tramite proiezione su un sottospazio di polinomi, che trovo trattata in maniera ipersommaria in due paginette dello Strang, Algebra lineare, testo che devo ammettere che non mi piace affatto per la mancanza di dimostrazioni rigorose -e spesso proprio di dimostrazioni, che sono ciò che della matematica trovo più bello e più importante-, ma con cui sto studiando algebra lineare usandolo soprattutto perché è ricchissimo di esercizi, quando sono a casa ed ho carta e penna, mentre come lettura da passeggio uso il Sernesi, Geometria I, che trovo decisamente soddisfacente come manuale di matematica. In questo senso cerco di beneficiare del meglio dell'uno e dell'altro, per quanto riguarda l'algebra lineare, come consigli di fare a proposito dell'analisi numerica e funzionale. Se poi trovo argomenti non di pertinenza del Sernesi, ma trattati in maniera tanto sommaria sullo Strang, normalmente cerco approfondimenti su Internet...
Grazie di cuore di nuovo a tutti!
Sì, sì, si tratta di un'approssimazione ai minimi quadrati tramite proiezione su un sottospazio di polinomi, che trovo trattata in maniera ipersommaria in due paginette dello Strang, Algebra lineare, testo che devo ammettere che non mi piace affatto per la mancanza di dimostrazioni rigorose -e spesso proprio di dimostrazioni, che sono ciò che della matematica trovo più bello e più importante-, ma con cui sto studiando algebra lineare usandolo soprattutto perché è ricchissimo di esercizi, quando sono a casa ed ho carta e penna, mentre come lettura da passeggio uso il Sernesi, Geometria I, che trovo decisamente soddisfacente come manuale di matematica. In questo senso cerco di beneficiare del meglio dell'uno e dell'altro, per quanto riguarda l'algebra lineare, come consigli di fare a proposito dell'analisi numerica e funzionale. Se poi trovo argomenti non di pertinenza del Sernesi, ma trattati in maniera tanto sommaria sullo Strang, normalmente cerco approfondimenti su Internet...
Grazie di cuore di nuovo a tutti!