Derivata direzionale

zio_mangrovia
Data la seguente definizione di derivata direzionale:

sia $f:\Omega->RR$, $\Omega sube RR^n$ e $x_0in\Omega$
Si dice che f è derivabile nella direzione di $v$, $vinR^n\\{\phi}$, se esiste finito il limite di:

$lim_(h->0)(f(x_0+hv)-f(x_0))/h$

Mi chiedo:
1- sarebbe stato più corretto affermare:
si dice che f è derivabile nella direzione di $v$ nel punto $x_0$.
2- non capisco il prodotto $hv$ cosa rappresenti, ero rimasto al concetto di derivata in $RR$ ma qua non capisco perché $h$ è moltiplicato per un vettore $v$?
3- veniamo alla nota dolente, in quanto gli appunti riportano:
se si pone $h(t)=f(x+tv)$ allora $h$ è una funzione scalare di variabile scalare per tutti per i $t$ per i quali $(x_0+tv)in dom f$ e la derivata direzionale appena definita coincide con $h'(0)$
Il 3o punto per me è completamente oscuro, se qualcuno mi fa la gentilezza di spiegarmelo in termini "umani"
grazie

Risposte
anto_zoolander
$1•$ puoi dire tranquillamente che $f$ è derivabile in $x_0$ lungo la direzione $vec(v)$ intendendo che:

$• exists l inRR:lim_(h->0)(f(x_0+hvec(v))-f(x_0))/h=l$

O più conciso con $(partialf(x_0))/(partialvec(v))=l$

Chiamerò $RR_V^n$ l’insieme visto come spazio vettoriale e $RR_A^n$ visto come spazio affine.
$2•$ il prodotto $hvec(v)$ è chiaramente il prodotto per scalare tra $h$ e $vec(v)$
In poche parole si può considerare $RR_V^n$ una volta come spazio affine e una come spazio vettoriale.
La struttura come spazio affine ti permette di definire la somma tra un punto e un vettore, nella fattispecie ti permette di dare un senso alla scrittura $x_0+hvec(v)$ dove $x_0$ è un punto e $hvec(v)$ è un vettore al variare di $h$ in un certo intervallo(che ora vedremo).

Per struttura di spazio affine sai che
$forallx_0inRR_A^nforallvec(w)inRR_V^n exists!y_0inRR_A^n:y_0-x_0=vec(w)$
Quindi induce una applicazione per cui $y_0=a(x_0,vec(w)):=x_0+vec(w)$

$3•$ si comincia considerando $OmegasubsetRR_A^n$ un sottoinsieme aperto di $RR_A^n$ e una funzione $f:Omega->RR$
Ora poiché $Omega$ è aperto, comunque preso $x_0 inOmega existsr>0:B(x_0,r)subsetOmega$

Perfetto ora consideriamo l’insieme $H(x_0):={h inRR:x_0+hvec(v) inOmega}$
Chiaramente $H(x_0)$ è non vuoto perché contiene $h=0$ ma in particolare per l’osservazione fatta prima $H(x_0)$ contiene interamente tutto l’intervallo aperto $(-r,r)$ poiché per $|h|
$||(x_0+hvec(v))-x_0||=|h|*||vec(v)||=|h|h inH(x_0)$

chiaramente $vec(v)$ è una direzione, ovvero un versore.
Inoltre comunque preso un vettore non nullo, esso può essere sempre normalizzato.

Quindi è ben definita la funzione $g:H(x_0)->RR$ definita componendo $f$ con la funzione
$r:H(x_0)->Omega$ definita come $r(h)=x_0+hvec(v)$
Ovvero $g:=fcircr:H(x_0)->Omega->RR$

Questa funzione ammette $h=0$ come punto di accumulazione e quindi possiamo farci limiti. Pertanto

$lim_(h->0)(f(x_0+hvec(v))+f(x_0))/h=lim_(h->0)(g(h)-g(0))/h$

E pertanto $(partialf)/(partialvec(v))(x_0)=g’(0)$
Ovvero uno esiste se e solo se esiste l’altro e tali derivate vengono chiamate ‘derivate direzionali’ e l’insieme $A_(vec(v))={x_0 inOmega|exists l inRR:(partialf)/(partialvec(v))(x_0)=l}$ è detto insieme di derivabilità di $f$ lungo la direzione $vec(v)$
Poiché l’esistenza del limite, ne garantisce anche l’unicitá è ben definita la funzione $(partialf)/(partialvec(v)):A_(vec(v))->RR$
Nonché la funzione derivata direzionale lungo $vec(v)$

Per brevità scriverò $partial_(vec(v))f$
$4•$ questo te lo aggiungo io, è una cosa che va osservata a mio avviso.
Fissiamo una base di $RR_V^n$, sia essa $B={vec(e_1),...,vec(e_n)}$ di vettori di norma unitaria e consideriamo gli insiemi $A_(vec(e_j)),forall j=1,...,n$ ovvero gli insiemi di derivabilità della funzione lungo le direzioni fissate nella base

Diremo che $f$ è derivabile in un punto $x_0 inOmega$ se $x_0 in bigcap_(k=1)^(n)A_(vec(e_k)):=Omega’$ ovvero se $f$ è derivabile nel punto lungo tutte le direzioni della base fissata. Chiaramente $Omega’subseteqOmega$ e tale insieme sarà l’insieme di derivabilità della funzione su questa base(se $Omega=Omega’$ allora $f$ si dirà derivabile in $Omega$)
Questa considerazione ci permette di definire la così detta funzione gradiente di $f$ definita come

$nablaf:Omega’->RR_V^n$
$nablaf(x_0)=sum_(k=1)^(n)partial_(vec(e_k))f(x_0)*vec(e_k)$

Questa funzione è un campo vettoriale che associa a ogni punto dello spazio $Omega’subseteqRR_A^n$ un vettore di $RR_V^n$
Tale funzione è ben definita perché in quell’insieme tutte le derivate direzionali della base esistono e tali derivate, vengono chiamate derivate parziali.
In poche parole le derivate parziali sono le derivate direzionali calcolate lungo le direzioni fissate dalla base.
Questo discorso puoi farlo per ogni spazio affine su se stesso(quantomeno di dimensione finita).

NOTA
Molto spesso, anzi quasi sempre, si omette questa distinzione tra spazio affine e vettoriale che in realtà a mio avviso da una più ampia visione di ciò che si sta trattando, sopratutto a livello concettuale, perché:

$•$ non ha senso sommare punti, ma vettori si(anche se particolari somme di punti ci sono).
$•$ non ha senso parlare di lunghezze di punti e angolo tra punti, tra vettori si.

Quindi bisogna comunque rendersi conto delle differenze che ci sono tra le due strutture e come sono collegate tra loro.

avevo bisogno di scrivere, spero di averti anche aiutato.

zio_mangrovia
Mi viene anche il dubbio perché $vinR^n\\{\phi}$ ?

"anto_zoolander":

si comincia considerando $OmegasubsetRR_A^n$ un sottoinsieme aperto di $RR_A^n$ e una funzione $f:Omega->RR$
Ora poiché $Omega$ è aperto, comunque preso $x_0 inOmega existsr>0:B(x_0,r)subsetOmega$


Approfitto per domandare se ci sono testi validi che forniscano le definizioni corrette riguardo la topologia in quanto gli appunti devono essere revisionati accuratamente infatti riportano:
insieme aperto $AAx in\Omega, EE\rho>0: B_\rho(x)sube\Omega$
Non si parla di inclusione in senso stretto su $\Omega$. $sub$ o $sube$ ?

Perfetto ora consideriamo l’insieme $H(x_0):={h inRR:x_0+hvec(v) inOmega}$

In pratica è come $H(x_0)$ fosse l'insieme dei punti $x_0$ traslati dalla componente vettoriale $hvec(v)$ ? Cioè i punti definiti al punto $1!$ come $y_0$, corretto?


Chiaramente $H(x_0)$ è non vuoto perché contiene $h=0$ ma in particolare per l’osservazione fatta prima $H(x_0)$ contiene interamente tutto l’intervallo aperto $(-r,r)$ poiché per $|h|
in pratica gli $y_0$ stanno tutti dentro $\Omega$, giusto?


$||(x_0+hvec(v))-x_0||=|h|*||vec(v)||=|h|h inH(x_0)$
chiaramente $vec(v)$ è una direzione, ovvero un versore.

Qua nasce un dubbio, la formula mi è chiara ma non capisco perché si parla di versore... così interpreto che il concetto di derivata direzionale riguarda solo per i versori ma nelle definizioni questo è contemplato solo nella derivata parziale (come hai esposto anche tu successivamente) dove si dice:
le derivate nella direzione della base canonica $e_1,.., e_n$ si chiamano derivate parziali.
Dove sbaglio l'interpretazione?

Quindi è ben definita la funzione $g:H(x_0)->RR$ definita componendo $f$ con la funzione
$r:H(x_0)->Omega$ definita come $r(h)=x_0+hvec(v)$
Ovvero $g:=fcircr:H(x_0)->Omega->RR$

Quindi definisco la funzione $r$ per arrivare a definire il rapporto incrementale e dimostrando che $h=0$ è un punto di accumulazione, cioè che esiste sempre un suo intorno tutto contenuto in $omega$, ok?

Ovvero uno esiste se e solo se esiste l’altro e tali derivate vengono chiamate ‘derivate direzionali’

Intendi il limite esiste se e solo se esiste l'altro limite?
Non ho ben compreso quali sarebbero questi limiti, ne vedo soltanto uno quello definito dall'unico rapporto incrementale.


Spiegazione a dir poco brillante che mi ha illuminato diversi concetti a me prima oscuri.
Grazie

dissonance
@zio mangrovia: sono d'accordo sul tuo punto 1 (derivata nel punto x0 lungo la direzione v).

anto_zoolander
@dissonance: penso di essere migliore nel rispondere alle domande, che a porle.... è un gran problema.


@zio
In algebra lineare, dato $(V,*)$ uno spazio euclideo di dimensione finita(preciso finita perché attualmente le mie competenze arrivano a questo) un versore(vettore di modulo unitario) è anche detto vettore direzione.

Il fatto è che uno spazio vettoriale sprovvisto di prodotto scalare, sostanzialmente geometricamente non è nulla.
Quando introduci il concetto di prodotto scalare hai la possibilità di interpretare geometricamente tali elementi, dando le giuste definizioni.

si ha bisogno di avere dei particolari vettori che mi diano solo tre informazioni interessanti: angoli, versi, direzioni.
In poche parole vogliamo sottolineare solo alcuni invarianti geometrici

$1)$ due vettori dipendenti hanno lo stesso verso se il fattore di proporzionalità è positivo. Hanno verso opposto se negativo

angolo$•$


direzione$•$


Quindi abbiamo visto che i versori di una retta lasciano invariati angoli, direzioni e versi. A noi importa questo, la lunghezza di un vettore ci importa per le distanze e cose simili, per il resto possiamo usare versori.
Per questo i versori vengono anche detti ‘direzioni’ ed è il motivo per cui li usiamo maggiormente nelle derivate. Anche perché vale la pena fare la seguente osservazione

Supponiamo ben $f:Omega->RR$ sia derivabile in $x_0$ lungo $v$, allora:

$partial_(lambdav)f(x_0)=lim_(t->0)(f(x_0+t(lambdav))-f(x_0))/t=$
$=lambda*lim_(lambdat->0)(f(x_0+(lambdat)v)-f(x_0))/(lambdat)=lambda*partial_(v)f(x_0)$

questo per quanto riguarda i versori

Per quanto riguarda la definizione ‘topologica’ se non vado errato l’inclusione in generale deve essere stretta.
Un ottimo libro, anche molto rigoroso, è il De Marco di analisi due.

Per quanto riguarda $H(x_0)$ non proprio, non è una vera e propria traslazione.
È l’insieme di tutti e soli gli scalari $h$ per cui il bettore $hv$ applicato in $x_0$ individua un punto di $Omega$
In poche parole $h inH(x_0)<=>existsy_0 inOmega:y_0-x_0=hvec(v)$ quindi in poche parole l’insieme $H(x_0)$ ti da un’idea di quanto possa estendersi il vettore $v$ per trovare punti dell’insieme.

Tutti gli $y_0$ della forma $x_0+hvec(v),h in(-r,r)$ stanno tutti in $Omega$, esatto.

Per quanto riguarda la funzione $r$ è una formalità che pochi libri si concedono, è per comprendere meglio la situazione e molto spesso non viene preso in considerazione.
Definire la funzione $g:=fcircr$ equivale al dire ‘voglio calcolare le quote dei punti che stanno sulla retta $r$ e che appartengono al dominio della funzione’.

Più formalmente tu stai calcolando $fcircr:H(x_0)->Omega->RR$
$r:h|->x_0+h*v$
$fcircr:x_0+h*v|->f(x_0+h*v)$
Quindi la funzione $r$ ti trova i punti della retta, la funzione $f$ ti calcola le corrispondenti quote.

Di fatto si tratta di calcolare $f(r(H(x_0))$ ovvero l’immagine dei punti di una retta.
È una particolarizzazione della funziona calcolata lungo il sostegno di una curva.

Quei limiti sono uguali. Solo che sono scritti in due modi diversi, introdurre la funzione $g$ lascia spiccare il motivo per cui si considera una funzione di una variabile, chi sia questa variabile e a cosa serva tale introduzione.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.