Formula di Taylor in $\vec x \in RR^n$
Ciao, amici! Scrivendo il differenziale di ordine $j$ nel punto $\vec x \in A$ di una funzione $f \in C^j (A)$ con $A$ aperto, chiamando l'incremendo $\vec h=(h_1,...,h_n)$, come
\[ d_{\vec x}^j f(\vec h) = \sum_{i_1 =1}^{n}···\sum_{i_j =1}^{n} \partial_{i_1...i_j}^j f(\vec x)h_{i_1}...h_{i_j} \]
dove $\partial_n f(\vec x)$ è la derivata parziale rispetto alla componente $x_n$ di $\vec x$, la formula di Taylor all'ordine $k$ con resto di Lagrange è, per un opportuno \(\vec \xi \in (\vec x , \vec x+\vec h)\),
\[f(\vec x + \vec h) =\sum_{j=1}^{k-1} \frac{d_{\vec x}^j f(\vec h)}{j!} + \frac{d_{\vec \xi}^k f(\vec h)}{k!}. \]
Vorrei dimostrare a me stesso la formula di Taylor con resto di Peano, cioè che
\[f(\vec x + \vec h) =\sum_{j=1}^{k} \frac{d_{\vec x}^j f(\vec h)}{j!} + o(||\vec h||^k),\text{ }||\vec h|| \rightarrow 0. \]
Per fare questo cercherei di dimostrare che \(d_{\vec \xi}^k f(\vec h) - d_{\vec x}^k f(\vec h) = o(||\vec h||^k) \).
Per $j=1$ non mi sembrerebbe particolarmente difficile utilizzando la disuguaglianza di Cauchy-Schwartz, perché mi pare che:
\[ | d_{\vec x}^k f(\vec h) - d_{\vec \xi}^k f(\vec h) |=\begin{vmatrix} \sum_{i=1}^{n} (\partial_i f(\vec x) -\partial_i f(\vec \xi))h_i \end{vmatrix}=\begin{vmatrix} \begin{pmatrix} \partial_1 f(\vec x)-\partial_1 f(\vec \xi) \\\ \vdots \\\ \partial_n f(\vec x)-\partial_n f(\vec \xi) \end{pmatrix} · \begin{pmatrix} h_1 \\\ \vdots \\\ h_n \end{pmatrix} \end{vmatrix} \leq \epsilon ||\vec h||\]
dove $\epsilon$ è la norma del vettore scritto a sinistra nel prodotto scalare, che ha per componenti le differenze delle derivate parziali e che non solo è limitato, ma tende anche a 0 per \(|| \vec h || \rightarrow 0\) dato che il punto di coordinate $\vec \xi$ sta proprio sul segmento tra l'origine e il punto di coordinate $\vec h$ e \(|| \vec \xi ||<|| \vec h ||\) ($f$ è di derivata continua in $\vec x$).
Per $j>=2$ mi verrebbe da procedere notando che ad ogni successivo $j$ la forma di \(d_{\vec x}^j f(\vec h)\) e anche \(d_{\vec x}^j f(\vec h)- d_{\vec \xi}^j f(\vec h)\) si può pensare ottenuta moltiplicando scalarmente per $\vec h$ un vettore (chiamiamolo $\vec a$) le cui componenti sono dei polinomi in \(h_{i_1},...,h_{i_{j-1}} \) con coefficienti \( \partial_{i_1...i_{j-1}}^{j-1} f(\vec x)-\partial_{i_1...i_{j-1}}^{j-1} f(\vec \xi) \), con i vari indici $i_k \in NN$ che variano da 1 a $n$, di grado $j-1$ e quindi osserverei che, sempre per la disuguaglianza di Cauchy-Schwartz, \(|\vec a·\vec h| \leq ||\vec h|| \sqrt{\vec a ·\vec a}\) ma anche $\vec a * \vec a$ si può pensare come prodotto di un vettore (lo chiamo $\vec b_1$) che ha per componenti dei polinomi di grado $2(j-2)$ con coefficienti che tendono a 0 per \(||\vec h|| \rightarrow 0\) (e quindi $\vec \xi -> \vec \x$) moltiplicato scalarmente per \((h_1^2,...,h_n^2)\), che è di norma \(||(h_1^2,...,h_n^2)||^2 \leq ||\vec h||^4\) e quindi \(||(h_1^2,...,h_n^2)|| \leq ||\vec h||^2\). Per cui mi pare che, procedendo "a ritroso" ricorsivamente "riscrivendo" ogni \( ||\vec b_k||^2 =\vec b_k·\vec b_k \) -dove ogni $\vec b_k$ ha per componenti polinomi di grado $2^k(j-1-k)$- come come prodotto scalare di \(\vec b_{k+1}\) -con componenti polinomi di grado $2^{k+1}(j-1-k-1)$- per \((h_1^{2k+1},...,h_n^{2k+1})\) (che è un vettore di norma inferiore a \(||\vec h||^{2k+1}\)), si abbia che \( |\vec a · \vec h| \leq ||\vec h|| ||\vec a||\leq ||\vec h||^2 \sqrt{||\vec b||} \leq ...\leq ||\vec h||^k \text{ } \sqrt[2^k]{ ||\vec b_k|| ||\vec h||^{2k} } \leq ... \leq ||\vec b_{j-1}|| ||\vec h||^j\) dove $\vec b_{j-1}$ è un vettore che ha nelle componenti differenze delle derivate parziali in $\vec x$ e $\vec \xi$, differenze che tendono tutte a 0 per \(||\vec h|| \rightarrow 0\).
Il mio tentativo di dimostrazione mi sembra un po' maldestro... Qualcuno ha idee migliori (o magari anche solo una forma più ordinata da suggerire per scriverlo -sono autodidatta e non ho tesine o altro da consegnare, ma mi piacerebbe prendere nota di una dimostrazione sensata e meno pasticciata a margine del mio testo di analisi...-, ammesso e non concesso che il mio impiastro sia concettualmente corretto)? Su Internet trovo tantissimo su polinomi e serie di Taylor in una variabile, ma nessuna dimostrazione in $n$ variabili...
Grazie di cuore a tutti!
\[ d_{\vec x}^j f(\vec h) = \sum_{i_1 =1}^{n}···\sum_{i_j =1}^{n} \partial_{i_1...i_j}^j f(\vec x)h_{i_1}...h_{i_j} \]
dove $\partial_n f(\vec x)$ è la derivata parziale rispetto alla componente $x_n$ di $\vec x$, la formula di Taylor all'ordine $k$ con resto di Lagrange è, per un opportuno \(\vec \xi \in (\vec x , \vec x+\vec h)\),
\[f(\vec x + \vec h) =\sum_{j=1}^{k-1} \frac{d_{\vec x}^j f(\vec h)}{j!} + \frac{d_{\vec \xi}^k f(\vec h)}{k!}. \]
Vorrei dimostrare a me stesso la formula di Taylor con resto di Peano, cioè che
\[f(\vec x + \vec h) =\sum_{j=1}^{k} \frac{d_{\vec x}^j f(\vec h)}{j!} + o(||\vec h||^k),\text{ }||\vec h|| \rightarrow 0. \]
Per fare questo cercherei di dimostrare che \(d_{\vec \xi}^k f(\vec h) - d_{\vec x}^k f(\vec h) = o(||\vec h||^k) \).
Per $j=1$ non mi sembrerebbe particolarmente difficile utilizzando la disuguaglianza di Cauchy-Schwartz, perché mi pare che:
\[ | d_{\vec x}^k f(\vec h) - d_{\vec \xi}^k f(\vec h) |=\begin{vmatrix} \sum_{i=1}^{n} (\partial_i f(\vec x) -\partial_i f(\vec \xi))h_i \end{vmatrix}=\begin{vmatrix} \begin{pmatrix} \partial_1 f(\vec x)-\partial_1 f(\vec \xi) \\\ \vdots \\\ \partial_n f(\vec x)-\partial_n f(\vec \xi) \end{pmatrix} · \begin{pmatrix} h_1 \\\ \vdots \\\ h_n \end{pmatrix} \end{vmatrix} \leq \epsilon ||\vec h||\]
dove $\epsilon$ è la norma del vettore scritto a sinistra nel prodotto scalare, che ha per componenti le differenze delle derivate parziali e che non solo è limitato, ma tende anche a 0 per \(|| \vec h || \rightarrow 0\) dato che il punto di coordinate $\vec \xi$ sta proprio sul segmento tra l'origine e il punto di coordinate $\vec h$ e \(|| \vec \xi ||<|| \vec h ||\) ($f$ è di derivata continua in $\vec x$).
Per $j>=2$ mi verrebbe da procedere notando che ad ogni successivo $j$ la forma di \(d_{\vec x}^j f(\vec h)\) e anche \(d_{\vec x}^j f(\vec h)- d_{\vec \xi}^j f(\vec h)\) si può pensare ottenuta moltiplicando scalarmente per $\vec h$ un vettore (chiamiamolo $\vec a$) le cui componenti sono dei polinomi in \(h_{i_1},...,h_{i_{j-1}} \) con coefficienti \( \partial_{i_1...i_{j-1}}^{j-1} f(\vec x)-\partial_{i_1...i_{j-1}}^{j-1} f(\vec \xi) \), con i vari indici $i_k \in NN$ che variano da 1 a $n$, di grado $j-1$ e quindi osserverei che, sempre per la disuguaglianza di Cauchy-Schwartz, \(|\vec a·\vec h| \leq ||\vec h|| \sqrt{\vec a ·\vec a}\) ma anche $\vec a * \vec a$ si può pensare come prodotto di un vettore (lo chiamo $\vec b_1$) che ha per componenti dei polinomi di grado $2(j-2)$ con coefficienti che tendono a 0 per \(||\vec h|| \rightarrow 0\) (e quindi $\vec \xi -> \vec \x$) moltiplicato scalarmente per \((h_1^2,...,h_n^2)\), che è di norma \(||(h_1^2,...,h_n^2)||^2 \leq ||\vec h||^4\) e quindi \(||(h_1^2,...,h_n^2)|| \leq ||\vec h||^2\). Per cui mi pare che, procedendo "a ritroso" ricorsivamente "riscrivendo" ogni \( ||\vec b_k||^2 =\vec b_k·\vec b_k \) -dove ogni $\vec b_k$ ha per componenti polinomi di grado $2^k(j-1-k)$- come come prodotto scalare di \(\vec b_{k+1}\) -con componenti polinomi di grado $2^{k+1}(j-1-k-1)$- per \((h_1^{2k+1},...,h_n^{2k+1})\) (che è un vettore di norma inferiore a \(||\vec h||^{2k+1}\)), si abbia che \( |\vec a · \vec h| \leq ||\vec h|| ||\vec a||\leq ||\vec h||^2 \sqrt{||\vec b||} \leq ...\leq ||\vec h||^k \text{ } \sqrt[2^k]{ ||\vec b_k|| ||\vec h||^{2k} } \leq ... \leq ||\vec b_{j-1}|| ||\vec h||^j\) dove $\vec b_{j-1}$ è un vettore che ha nelle componenti differenze delle derivate parziali in $\vec x$ e $\vec \xi$, differenze che tendono tutte a 0 per \(||\vec h|| \rightarrow 0\).
Il mio tentativo di dimostrazione mi sembra un po' maldestro... Qualcuno ha idee migliori (o magari anche solo una forma più ordinata da suggerire per scriverlo -sono autodidatta e non ho tesine o altro da consegnare, ma mi piacerebbe prendere nota di una dimostrazione sensata e meno pasticciata a margine del mio testo di analisi...-, ammesso e non concesso che il mio impiastro sia concettualmente corretto)? Su Internet trovo tantissimo su polinomi e serie di Taylor in una variabile, ma nessuna dimostrazione in $n$ variabili...
Grazie di cuore a tutti!
Risposte
Caspita, che post. E che notazioni! Purtroppo, Davide, leggerlo tutto è una impresa titanica: secondo me ti conviene cambiare approccio. Ti dico come, personalmente, preferisco vedere queste cose: secondo me la migliore formulazione del resto n-esimo è quella integrale. Infatti, supponendo che \(A\) sia convesso (così non abbiamo problemi con i segmenti), e che \(f \colon A \to \mathbb{R}\) [size=80](*)[/size] sia di classe \(C^k\), possiamo formare la funzione di una sola variabile reale
\[\varphi(\lambda)=f(x+\lambda h), \qquad \lambda \in [0, 1].\]
Questa funzione è \(C^k\) e può essere espansa in serie di Taylor attorno a \(\lambda=0\) arrestata al \(k\)-esimo ordine, con valutazione integrale del resto: clic. Valutando poi \(\lambda=1\) si ottiene lo sviluppo di Taylor con resto integrale.
A questo punto bisogna passare dalla formulazione integrale a quella di Peano, ma questo mi pare sia più semplice rispetto a quello che stai facendo tu qui: infatti si tratta soltanto di stimare un integrale. Questo procedimento è seguito sul libro Undergraduate analysis di Lang, ai capitoli "Functions on \(n\)-space" e "Derivatives in vector spaces".
__________________________
(*) Questo approccio funziona così com'è anche per funzioni a valori complessi o vettoriali. Non è così per la formulazione del resto secondo Lagrange che richiede espressamente funzioni a valori reali.
\[\varphi(\lambda)=f(x+\lambda h), \qquad \lambda \in [0, 1].\]
Questa funzione è \(C^k\) e può essere espansa in serie di Taylor attorno a \(\lambda=0\) arrestata al \(k\)-esimo ordine, con valutazione integrale del resto: clic. Valutando poi \(\lambda=1\) si ottiene lo sviluppo di Taylor con resto integrale.
A questo punto bisogna passare dalla formulazione integrale a quella di Peano, ma questo mi pare sia più semplice rispetto a quello che stai facendo tu qui: infatti si tratta soltanto di stimare un integrale. Questo procedimento è seguito sul libro Undergraduate analysis di Lang, ai capitoli "Functions on \(n\)-space" e "Derivatives in vector spaces".
__________________________
(*) Questo approccio funziona così com'è anche per funzioni a valori complessi o vettoriali. Non è così per la formulazione del resto secondo Lagrange che richiede espressamente funzioni a valori reali.
Grazie, Dissonance!!! Non conoscevo la formulazione integrale del resto: molto interessante! Per quanto riguarda la notazione, eccetto $\vec a$ e $\vec b_k$, che ho introdotto per non scrivere formule molto più "ingombranti", è proprio quella del mio testo...
Grazie ancora!!!
Grazie ancora!!!
Spero di averti convinto, io in realtà non ho fatto proprio nulla se non suggerire una strada alternativa. Che poi in ultima analisi ti porterà a fare gli stessi conti ma in versione integrale invece che in versione differenziale. Personalmente mi pare più semplice ragionare sugli integrali.