Gaussiana e condizione di Mercer
Buonasera a tutti,
sto tentando di dimostrare che la gaussiana soddisfa la condizione di Mercer.
Per chiarezza riporto l'enunciato:
Sia $\bb\varphi$ una trasformazione $\bb\varphi:\mathbb{R}^d->\mathcal{H}$ e si supponga fissato un prodotto interno in $\mathcal{H}$.
La condizione di Mercer stabilisce che $K(\bbx,\bby)$ è una funzione Kernel tale per cui $K(\bbx,\bby)=\langle\bb\varphi(\bbx),\bb\varphi(\bby)\rangle$ se:
Vorrei dimostrare che la gaussiana soddisfa tale condizione, ma non ci riesco.
Qualcuno potrebbe darmi un input? Grazie!
sto tentando di dimostrare che la gaussiana soddisfa la condizione di Mercer.
Per chiarezza riporto l'enunciato:
Sia $\bb\varphi$ una trasformazione $\bb\varphi:\mathbb{R}^d->\mathcal{H}$ e si supponga fissato un prodotto interno in $\mathcal{H}$.
La condizione di Mercer stabilisce che $K(\bbx,\bby)$ è una funzione Kernel tale per cui $K(\bbx,\bby)=\langle\bb\varphi(\bbx),\bb\varphi(\bby)\rangle$ se:
$\int\intK(\bbx,\bby)g(\bbx)g(\bby)d\bbxd\bby>=0, \forall g(\bbx):\int g^2(\bbx)d\bbx<\infty$.
Vorrei dimostrare che la gaussiana soddisfa tale condizione, ma non ci riesco.
Qualcuno potrebbe darmi un input? Grazie!

Risposte
Dovresti specificare meglio cosa stai cercando di fare. La Gaussiana sarebbe la funzione "a campana" $e^{-\lvert x\rvert^2}$, immagino? Ma cosa c'entra con \(K(x, y)\)?
Si, perdonami dissonance, hai ragione, cerco di spiegarmi meglio.
E' una dimostrazione che mi verrebbe utile per la tesi e fa riferimento al paper presente qui:
pagina 18 (138), equazione (60) e pagina 20 (140) al paragrafo "Mercer's condition".
Da quanto ho capito io, esistono una certa $\bb\varphi:\mathfrak{D}\subseteq\mathbb{R}^d->H$ e una funzione kernel $K$ tali per cui si abbia:
con $\bbx,\bby\in\mathfrak{D}$.
Quindi dovrei far vedere che:
con la condizione su $g$ di cui al post precedente.
E' una dimostrazione che mi verrebbe utile per la tesi e fa riferimento al paper presente qui:
pagina 18 (138), equazione (60) e pagina 20 (140) al paragrafo "Mercer's condition".
Da quanto ho capito io, esistono una certa $\bb\varphi:\mathfrak{D}\subseteq\mathbb{R}^d->H$ e una funzione kernel $K$ tali per cui si abbia:
$K(\bbx,\bby)=\langle\bb\varphi(\bbx),\bb\varphi(\bby)\rangle=exp{-||\bbx-\bby||^2/(2\sigma^2)}$,
con $\bbx,\bby\in\mathfrak{D}$.
Quindi dovrei far vedere che:
$\intK(\bbx,\bby)g(\bbx)g(\bby)d\bbxd\bby=\intexp{-||\bbx-\bby||^2/(2\sigma^2)}g(\bbx)g(\bby)d\bbxd\bby>=0$,
con la condizione su $g$ di cui al post precedente.
Ah guarda allora secondo me è facile. E' tutta questione di trasformata di Fourier: applica il teorema di Parseval all'integrale in \(dx\) e nota che uno dei fattori è la trasformata di un prodotto di convoluzione, che quindi diventa il prodotto puntuale delle trasformate. Alla fine ti troverai con
\[
C_1\int e^{-C_2 \lvert \xi\rvert^2} \lvert \hat{g}(\xi)\rvert^2\, d\xi, \]
che è nonnegativo perché \(e^{-C_2\lvert \xi\rvert^2}\) lo è. (Le costanti \(C_1, C_2\) dipendono dalla convenzione usata per la trasformata, ma sono poco rilevanti).
Spero di essermi spiegato. Fammi sapere
\[
C_1\int e^{-C_2 \lvert \xi\rvert^2} \lvert \hat{g}(\xi)\rvert^2\, d\xi, \]
che è nonnegativo perché \(e^{-C_2\lvert \xi\rvert^2}\) lo è. (Le costanti \(C_1, C_2\) dipendono dalla convenzione usata per la trasformata, ma sono poco rilevanti).
Spero di essermi spiegato. Fammi sapere
Ti ringrazio molto dissonance.
Vediamo un po' se così può andar bene; spero di aver colto il tuo suggerimento!
Intanto siamo certi che la trasformata di $g$ esiste perché $g\inL^2(D)$.
Posso scrivere:
Ora, dato che la gaussiana è non negativa in tutto $\mathbb(R)$, la posizione:
equivale a far vedere che
Dunque, dalle relazioni sulle trasformate sopra:
Allora:
L'integrando (dell'integrando) dell'ultima quantità è finalmente uguale a $|\hat(g)(\xi)|^2$, quindi per il Teorema di Parseval:
per l'ipotesi di $g$ quadrato integrabile.
E' ovvio quindi che:
Che ne pensi dissonance?
Vediamo un po' se così può andar bene; spero di aver colto il tuo suggerimento!
Intanto siamo certi che la trasformata di $g$ esiste perché $g\inL^2(D)$.
Posso scrivere:
$g(x)=\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xix)d\xi\text{ }\text{ }\text{ }g(y)=\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xiy)d\xi$.
Ora, dato che la gaussiana è non negativa in tutto $\mathbb(R)$, la posizione:
$\int_{D}exp{-(x-y)^2/(2\sigma^2)}g(x)g(y)dxdy>=0$
equivale a far vedere che
$\int_{D}g(x)g(y)dxdy>=0$.
Dunque, dalle relazioni sulle trasformate sopra:
$\int_{D}[\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xix)d\xi][\int_{\mathbb{R}}\hat(g)(\eta)e^(i\etay)d\eta]dxdy
=\int_{D}[\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xix)d\xi]^2dxdy$.
=\int_{D}[\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xix)d\xi]^2dxdy$.
Allora:
$0<=|\int_{D}[\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xix)d\xi][\int_{\mathbb{R}}\hat(g)(\eta)e^(i\etay)d\eta]dxdy|<=\int_{D}|[\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xix)d\xi][\int_{\mathbb{R}}\hat(g)(\eta)e^(i\etay)d\eta]|dxdy<=\int_{D}|\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xix)d\xi||\int_{\mathbb{R}}\hat(g)(\eta)e^(i\etay)d\eta|dxdy=\int_{D}|\int_{\mathbb{R}}\hat(g)(\xi)e^(i\xix)d\xi|^2dxdy<=\int_{D}[\int_{\mathbb{R}}|\hat(g)(\xi)e^(i\xix)|^2d\xi]dxdy.$
L'integrando (dell'integrando) dell'ultima quantità è finalmente uguale a $|\hat(g)(\xi)|^2$, quindi per il Teorema di Parseval:
$\int_{\mathbb{R}}|\hat(g)(\xi)|^2d\xi=\int_{\mathbb{R}}|g(x)|^2dx=\int_{\mathbb{R}}g^2(x)dx=k<\infty$,
per l'ipotesi di $g$ quadrato integrabile.
E' ovvio quindi che:
$0<=\int_{D}[\int_{\mathbb{R}}|\hat(g)(\xi)e^(i\xix)|^2d\xi]dxdy=k\int_{D}dxdy=k\text{mis}(D)$
$\Rightarrow\int_{D}g(x)g(y)dxdy>=0$.
Che ne pensi dissonance?
No. L'integrale
\[
\iint g(x)g(y)\, dxdy\]
in generale non esiste. Pensa ad una funzione in \(L^2\) ma non in \(L^1\), come ad esempio
\[g(x)=\frac{1}{1+\lvert x\rvert}.\]
Non puoi sbarazzarti così del prodotto di convoluzione. Invece devi trasformarlo in Fourier:
\[
\mathcal{F}_{x\to \xi}\left( \int G(x-y)g(y)\,dy\right)= \hat{G}(\xi)\hat{g}(\xi).
\]
Quindi, applicando Parseval in \(dx\) (mi dimentico dei \(2\pi\) vari):
\[
\int dx\left( \int G(x-y)g(y)\,dy\right)\overline{g(x)}=\int d\xi \hat{G}(\xi)\hat{g}(\xi)\overline{\hat{g}(\xi)}\, d\xi\ge 0,\]
perché la trasformata della gaussiana \(G\) è una funzione reale e non negativa. Nota che ci ho messo un coniugato, perché è così che funziona il teorema di Parseval; in generale qui hai a che fare con numeri complessi. Però, se \(g\) è una funzione reale (come mi pare tu stia richiedendo), il membro sinistro dell'ultima formula è esattamente quello che ti serve.
\[
\iint g(x)g(y)\, dxdy\]
in generale non esiste. Pensa ad una funzione in \(L^2\) ma non in \(L^1\), come ad esempio
\[g(x)=\frac{1}{1+\lvert x\rvert}.\]
Non puoi sbarazzarti così del prodotto di convoluzione. Invece devi trasformarlo in Fourier:
\[
\mathcal{F}_{x\to \xi}\left( \int G(x-y)g(y)\,dy\right)= \hat{G}(\xi)\hat{g}(\xi).
\]
Quindi, applicando Parseval in \(dx\) (mi dimentico dei \(2\pi\) vari):
\[
\int dx\left( \int G(x-y)g(y)\,dy\right)\overline{g(x)}=\int d\xi \hat{G}(\xi)\hat{g}(\xi)\overline{\hat{g}(\xi)}\, d\xi\ge 0,\]
perché la trasformata della gaussiana \(G\) è una funzione reale e non negativa. Nota che ci ho messo un coniugato, perché è così che funziona il teorema di Parseval; in generale qui hai a che fare con numeri complessi. Però, se \(g\) è una funzione reale (come mi pare tu stia richiedendo), il membro sinistro dell'ultima formula è esattamente quello che ti serve.
Grazie ancora, ma perdonami.. Sarò ottuso, ma non capisco l'ultimo passaggio.
Ho capito che vedi l'integrale $\intG(x-y)g(y)dy$ come convoluzione, quindi $\intG(x-y)g(y)dy=\hat(G)(\xi)\hat(g)(\xi)$, ma non riesco a capire come utilizzare Parseval. Cioè:
ma mi sfugge il seguito.
Ti ringrazio ancora:)
Ho capito che vedi l'integrale $\intG(x-y)g(y)dy$ come convoluzione, quindi $\intG(x-y)g(y)dy=\hat(G)(\xi)\hat(g)(\xi)$, ma non riesco a capire come utilizzare Parseval. Cioè:
$\int\intG(x-y)g(y)g(x)dxdy=\int[\intG(x-y)g(y)dy]g(x)dy=\int\hat(G)(\xi)\hat(g)(\xi)g(x)dx$,
ma mi sfugge il seguito.
Ti ringrazio ancora:)
Ah aspetta, forse ci sono.
La funzione $G(x-y)g(y)$ è sicuramente $\in L^2$ perché $G$ è non negativa e $g\inL^2$ per ipotesi.
Quindi, tenuto conto che $\intG(x-y)g(y)dy$ è funzione della sola $x$, posso definire al solito
Dunque vale il Teorema di Plancherel (Parseval?) per cui:
Allora posso dire:
$\int[\intG(x-y)g(y)dy]\bar{g(x)}dx=1/(2\pi)\int\hat(G)(\xi)\hat(g)(\xi)\bar{\hat(g)(\xi)}d\xi=1/(2\pi)\int\hat(G)(\xi)|\hat(g)(\xi)|^2d\xi>=0.$
Sì, ora mi torna, direi che ho capito!
Grazie dissonance!!!
La funzione $G(x-y)g(y)$ è sicuramente $\in L^2$ perché $G$ è non negativa e $g\inL^2$ per ipotesi.
Quindi, tenuto conto che $\intG(x-y)g(y)dy$ è funzione della sola $x$, posso definire al solito
$\langle\intG(x-y)g(y)dy,g(x)\rangle=\int[\intG(x-y)g(y)dy]\bar{g(x)}dx$.
Dunque vale il Teorema di Plancherel (Parseval?) per cui:
$\langlef,g\rangle=1/(2\pi)\langle\hat(f),\hatg\rangle$.
Allora posso dire:
$\int[\intG(x-y)g(y)dy]\bar{g(x)}dx=1/(2\pi)\int\hat(G)(\xi)\hat(g)(\xi)\bar{\hat(g)(\xi)}d\xi=1/(2\pi)\int\hat(G)(\xi)|\hat(g)(\xi)|^2d\xi>=0.$
Sì, ora mi torna, direi che ho capito!
Grazie dissonance!!!
Stavo rispondendo per scrivere proprio questo ma vedo che ci sei arrivato da solo.
Che dire, grazie mille dissonance, alla prossima!