Prodotto matriciale normato per la valutazione di derivati
Buongiorno a tutti ragazzi, sto studiando la valutazione di opzioni multiasset in programmazione robusta così come spiegata nei paper qui sotto
1) $\Gamma \in \mathbb{R}^+$ è un parametro che viene prestabilito dal decisore (colui che sta costruendo il modello di programmazione e quindi sta prezzando lo strumento) in funzione del suo particolare grado di avversione al rischio. Non è importante, per il momento, approfondire oltre.
2) $\tilde{R}_1=[ \tilde{S}_1^1/S_0^1 \ \ \tilde{S}_1^2/S_0^2 \ \ cdots \ \ \tilde{S}_1^M/S_0^M ] ^T$ è il vettore dei rendimenti aleatori di primo periodo ($t=1$) dato il prezzo corrente (e noto) dell'$m$-esimo asset incluso nel basket sottostante l'opzione multiattivo, per $m=1,...,M$.
3) $\hat{R}_1=[ \hat{S}_1^1/S_0^1 \ \ \hat{S}_1^2/S_0^2 \ \ cdots \ \ \hat{S}_1^M/S_0^M ] ^T$ è il vettore dei rendimenti attesi di primo periodo ($t=1$) dato il prezzo corrente (e noto) dell'$m$-esimo asset incluso nel basket sottostante l'opzione multiattivo, per $m=1,...,M$.
4) $C=sum{::}_(\ \)^(-1/2)$ è una matrice ottenuta con la decomposizione di Cholesky. I testi dicono $C^TC=sum{::}_(\ \)^(-1)$, dove $\sum$ è la matrice di varianze-covarianze dei rendimenti.
5) $||x||$ è (cito espressamente dal secondo paper, sempre pag. 31) "a general norm of a factor, depending on the modeler's preference, it can be $L_1,L_2,L_∞$ or $D$-norm." Il paper qui sotto
approfondisce il significato di $||x||$ ma non ben capito quello che viene detto. A pag. 513 dicono di considerare un insieme di incertezza per $\tilde{A}$ di forma \begin{Vmatrix} M(vec(\tilde{A})-vec(\hat{A})) \end{Vmatrix} che è $<=$ di un certo $\Delta>=0$, e per la Proposizione 1. di pag. 512 dicono che $||x||_p :=(\sum_(j=1)^(n)|x_j|^p)^(1/p)$ con $M$ una matrice diagonale contenente the inverses of the ranges of coefficient variation. Questo modo di "modellare" l'incertezza deriverebbe dal fatto che "Let $S$ be a closed, bounded convex set and consider an uncertainty set in which the uncertain coefficients are allowed to vary in such a way that the deviations from their nominal values fall in a convex set"
\begin{Bmatrix}
\tilde{A}|(vec(\tilde{A})-vec(\hat{A}))\in S
\end{Bmatrix}
"We consider uncertainty sets that arise from the requirement that the distance (as measured by an arbitrary norm) between uncertain coefficients and their nominal values is bounded."
Questo è quello che ho capito io, spero possiate aiutarmi a fare chiarezza.
Siccome in un'opzione multiasset è necessario tenere in considerazione la correlazione tra i prezzi degli asset inclusi nel basket sottostante l'opzione, gli autori consigliano (per le ipotesi di indipendenza e identica distribuzione, cioè stazionarietà in secondo ordine, che caratterizzano i log-rendimenti, da cui segue la normalità per il TLC: ci troviamo pertanto in un ambiente di Black e Scholes) di studiare la correlazione tra i rendimenti dei diversi titoli nota la condizione $R_t=S_t/S_0$ che lega prezzi e rendimenti. Chiaramente la correlazione dovrebbe essere valutata tra ogni $m$-esimo asset incluso nel basket (ovvero a dire, per ogni singola coppia di asset su un insieme di $M$ elementi) e per ogni $t$-esimo istante temporale. Ovviamente non è il caso di gestire un numero così elevato di dati, oltretutto soggetti ad incertezza, per cui anziché costruire una matrice di varianze-covarianze aleatoria per ogni singolo $t$...
...sfrutto le proprietà di $\sum$. So che $\sum$ è quadrata, simmetrica e definita positiva, quindi non-singolare, quindi invertibile, quindi esiste una $sum{::}_(\ \)^(-1)$. Siccome quest'ultima è anch'essa simmetrica e definita positiva posso fattorizzarla con Cholesky, che è una scomposizione LU per matrici simmetriche e definite positive. Dovrei quindi avere una matrice $C$ triangolare superiore con elementi positivi sopra la diagonale e una matrice $C^T$ triangolare inferiore normata (cioè con elementi sotto la diagonale uguali ad 1). E siccome l'intersezione tra $t$ matrici triangolari inferiori e $t$ matrici triangolari superiori ci dà $t$ matrici diagonali dovrei riuscire a ottenere $M$.
Da qui vado in confusione.
A) Da dove si capisce che $M$ contiene the inverses of the ranges of coefficient variation? E che cosa vorrebbe dire in italiano questa frase?
B) Dicono che modellando l'insieme di incertezza dei rendimenti in quel modo ci si assicura che a prescindere dalla futura realizzazione dei rendimenti il differenziale rispetto al loro valore atteso sarà sempre inferiore ad un certo $\Delta$. Ma perchè moltiplicare $M$ con il differenziale? Che cosa indica quel prodotto?
C) Nel secondo paper (pag. 31) l'autore fa l'esempio con la norma di $L_1$:
Si limita ad applicare la definizione di norma?
D) Dicono che la scelta della norma è a discrezione del decisore, ma cosa implica scegliere una norma piuttosto che un'altra? Che implicazioni ha questo sul numero di vincoli del problema?
(pag. 848, 5.1)
(pag. 31, 6.1)
(pag. 76, 6.2)
e sto trovando difficoltà a capire come gli autori arrivino alla condizione$||C(\tilde{R}_1-\hat{R}_1)|| \leq \Gamma$
(So che il "cappello" dovrebbe essere "verso il basso" ma non riesco ad inserirlo in Latex)
dove:1) $\Gamma \in \mathbb{R}^+$ è un parametro che viene prestabilito dal decisore (colui che sta costruendo il modello di programmazione e quindi sta prezzando lo strumento) in funzione del suo particolare grado di avversione al rischio. Non è importante, per il momento, approfondire oltre.
2) $\tilde{R}_1=[ \tilde{S}_1^1/S_0^1 \ \ \tilde{S}_1^2/S_0^2 \ \ cdots \ \ \tilde{S}_1^M/S_0^M ] ^T$ è il vettore dei rendimenti aleatori di primo periodo ($t=1$) dato il prezzo corrente (e noto) dell'$m$-esimo asset incluso nel basket sottostante l'opzione multiattivo, per $m=1,...,M$.
3) $\hat{R}_1=[ \hat{S}_1^1/S_0^1 \ \ \hat{S}_1^2/S_0^2 \ \ cdots \ \ \hat{S}_1^M/S_0^M ] ^T$ è il vettore dei rendimenti attesi di primo periodo ($t=1$) dato il prezzo corrente (e noto) dell'$m$-esimo asset incluso nel basket sottostante l'opzione multiattivo, per $m=1,...,M$.
4) $C=sum{::}_(\ \)^(-1/2)$ è una matrice ottenuta con la decomposizione di Cholesky. I testi dicono $C^TC=sum{::}_(\ \)^(-1)$, dove $\sum$ è la matrice di varianze-covarianze dei rendimenti.
5) $||x||$ è (cito espressamente dal secondo paper, sempre pag. 31) "a general norm of a factor, depending on the modeler's preference, it can be $L_1,L_2,L_∞$ or $D$-norm." Il paper qui sotto
approfondisce il significato di $||x||$ ma non ben capito quello che viene detto. A pag. 513 dicono di considerare un insieme di incertezza per $\tilde{A}$ di forma \begin{Vmatrix} M(vec(\tilde{A})-vec(\hat{A})) \end{Vmatrix} che è $<=$ di un certo $\Delta>=0$, e per la Proposizione 1. di pag. 512 dicono che $||x||_p :=(\sum_(j=1)^(n)|x_j|^p)^(1/p)$ con $M$ una matrice diagonale contenente the inverses of the ranges of coefficient variation. Questo modo di "modellare" l'incertezza deriverebbe dal fatto che "Let $S$ be a closed, bounded convex set and consider an uncertainty set in which the uncertain coefficients are allowed to vary in such a way that the deviations from their nominal values fall in a convex set"
\begin{Bmatrix}
\tilde{A}|(vec(\tilde{A})-vec(\hat{A}))\in S
\end{Bmatrix}
"We consider uncertainty sets that arise from the requirement that the distance (as measured by an arbitrary norm) between uncertain coefficients and their nominal values is bounded."
Nebbia...
Questo è quello che ho capito io, spero possiate aiutarmi a fare chiarezza.
Siccome in un'opzione multiasset è necessario tenere in considerazione la correlazione tra i prezzi degli asset inclusi nel basket sottostante l'opzione, gli autori consigliano (per le ipotesi di indipendenza e identica distribuzione, cioè stazionarietà in secondo ordine, che caratterizzano i log-rendimenti, da cui segue la normalità per il TLC: ci troviamo pertanto in un ambiente di Black e Scholes) di studiare la correlazione tra i rendimenti dei diversi titoli nota la condizione $R_t=S_t/S_0$ che lega prezzi e rendimenti. Chiaramente la correlazione dovrebbe essere valutata tra ogni $m$-esimo asset incluso nel basket (ovvero a dire, per ogni singola coppia di asset su un insieme di $M$ elementi) e per ogni $t$-esimo istante temporale. Ovviamente non è il caso di gestire un numero così elevato di dati, oltretutto soggetti ad incertezza, per cui anziché costruire una matrice di varianze-covarianze aleatoria per ogni singolo $t$...
[cioè considerare, una per una e per ogni $t$, tutte le possibili coppie di asset e per ogni $j$-esima possibile realizzazioni dei rendimenti (con $j=1,...,n$ ed $n$ la dimensione del campione estratta dalle serie storiche dei rendimenti) calcolare la somma dei prodotti incrociati degli scarti di tali possibili realizzazioni dai rispettivi valori attesi]
...sfrutto le proprietà di $\sum$. So che $\sum$ è quadrata, simmetrica e definita positiva, quindi non-singolare, quindi invertibile, quindi esiste una $sum{::}_(\ \)^(-1)$. Siccome quest'ultima è anch'essa simmetrica e definita positiva posso fattorizzarla con Cholesky, che è una scomposizione LU per matrici simmetriche e definite positive. Dovrei quindi avere una matrice $C$ triangolare superiore con elementi positivi sopra la diagonale e una matrice $C^T$ triangolare inferiore normata (cioè con elementi sotto la diagonale uguali ad 1). E siccome l'intersezione tra $t$ matrici triangolari inferiori e $t$ matrici triangolari superiori ci dà $t$ matrici diagonali dovrei riuscire a ottenere $M$.
Da qui vado in confusione.
A) Da dove si capisce che $M$ contiene the inverses of the ranges of coefficient variation? E che cosa vorrebbe dire in italiano questa frase?
B) Dicono che modellando l'insieme di incertezza dei rendimenti in quel modo ci si assicura che a prescindere dalla futura realizzazione dei rendimenti il differenziale rispetto al loro valore atteso sarà sempre inferiore ad un certo $\Delta$. Ma perchè moltiplicare $M$ con il differenziale? Che cosa indica quel prodotto?
C) Nel secondo paper (pag. 31) l'autore fa l'esempio con la norma di $L_1$:
Si limita ad applicare la definizione di norma?
D) Dicono che la scelta della norma è a discrezione del decisore, ma cosa implica scegliere una norma piuttosto che un'altra? Che implicazioni ha questo sul numero di vincoli del problema?
Risposte
Allora, ho provato in questi giorni a dimostrare quella condizione e questo è fin dove sono arrivato.
Noi vogliamo valutare la correlazione tra gli asset, e gli autori consigliano di costruire norme matriciali che definiscano, per ogni istante temporale, il range massimo di variazione dei prezzi aleatori (o per meglio dire dei rendimenti) intorno alle rispettive stime. Range che si dimostra essere, nel caso più piccolo (cioè $M=2$), un ellissi su uno spazio di probabilità $2d$-normale.
Mi pongo in uno spazio $l_2$, cioè lo spazio delle successioni quadrato sommabili (qui a valori reali per la natura dei rendimenti). Considero il vettore dei rendimenti aleatori di primo periodo $R_1$ che è un vettore $M$-dimensionale multivariato normalmente distribuito. Considero poi il vettore associato $\hat(R)_1$ dei rendimenti stimati, da cui segue l’espressione vettoriale $R_1-\hat(R)_1$ inerente lo scarto (in $t=1$) tra le singole possibili realizzazioni e le relative aspettative. Segue la funzione di densità di probabilità per $R_1$
Ora, il contorno di una normale multivariata è un ellissoide multidimensionale. Ma nel caso bivariato l’argomento dell’esponenziale, che è la norma di Mahalanobis $D_M^2≔(x-μ)^T ∑^(-1)(x-μ)$, rappresenta un fascio di ellissi. Cioè: $(x-μ)^T ∑^(-1)(x-μ) =c$. E so che l’equazione di un’ellisse è di tipo quadratico. Vado poi a fattorizzare la matrice di covarianze con Cholesky ed ottengo $∑^(-1)= C^T C$: allora l’argomento dell’esponenziale diventa $(R_1-\hat(R)_1 )^T C^T C(R_1-\hat(R)_1 )$, che è appunto una forma quadratica $x^T Ax$ con $A≡C^T C=∑^(-1)$ ed $x≡(R_1-\hat(R)_1 )$.
Ora mi blocco.
1) Come dimostro che $(R_1-\hat(R)_1 )^T C^T C(R_1-\hat(R)_1 )=||C(R_1-\hat(R)_1)||_2$? Definizione di norma euclidea?
2) Ottenuta $||C(R_1-\hat(R)_1)||_2$, considero un $\Gamma >=0$ tale che $||C(R_1-\hat(R)_1)||_2<=\Gamma$. Come dimostro che questa condizione equivale a
ma non so se mi è utile. Potete aiutarmi?
Grazie
Noi vogliamo valutare la correlazione tra gli asset, e gli autori consigliano di costruire norme matriciali che definiscano, per ogni istante temporale, il range massimo di variazione dei prezzi aleatori (o per meglio dire dei rendimenti) intorno alle rispettive stime. Range che si dimostra essere, nel caso più piccolo (cioè $M=2$), un ellissi su uno spazio di probabilità $2d$-normale.
Mi pongo in uno spazio $l_2$, cioè lo spazio delle successioni quadrato sommabili (qui a valori reali per la natura dei rendimenti). Considero il vettore dei rendimenti aleatori di primo periodo $R_1$ che è un vettore $M$-dimensionale multivariato normalmente distribuito. Considero poi il vettore associato $\hat(R)_1$ dei rendimenti stimati, da cui segue l’espressione vettoriale $R_1-\hat(R)_1$ inerente lo scarto (in $t=1$) tra le singole possibili realizzazioni e le relative aspettative. Segue la funzione di densità di probabilità per $R_1$
$f(R_1,\hat(R)_1,\sum)=(2\pi)^(-1/2)|\sum|^(-1/2)e^[-1/2((R_1-\hat(R)_1)\sum^(-1)(R_1-\hat(R)_1))]$
Ora, il contorno di una normale multivariata è un ellissoide multidimensionale. Ma nel caso bivariato l’argomento dell’esponenziale, che è la norma di Mahalanobis $D_M^2≔(x-μ)^T ∑^(-1)(x-μ)$, rappresenta un fascio di ellissi. Cioè: $(x-μ)^T ∑^(-1)(x-μ) =c$. E so che l’equazione di un’ellisse è di tipo quadratico. Vado poi a fattorizzare la matrice di covarianze con Cholesky ed ottengo $∑^(-1)= C^T C$: allora l’argomento dell’esponenziale diventa $(R_1-\hat(R)_1 )^T C^T C(R_1-\hat(R)_1 )$, che è appunto una forma quadratica $x^T Ax$ con $A≡C^T C=∑^(-1)$ ed $x≡(R_1-\hat(R)_1 )$.
Ora mi blocco.
1) Come dimostro che $(R_1-\hat(R)_1 )^T C^T C(R_1-\hat(R)_1 )=||C(R_1-\hat(R)_1)||_2$? Definizione di norma euclidea?
2) Ottenuta $||C(R_1-\hat(R)_1)||_2$, considero un $\Gamma >=0$ tale che $||C(R_1-\hat(R)_1)||_2<=\Gamma$. Come dimostro che questa condizione equivale a
\begin{matrix}
\sum_{i=1}^MC_{m,i}\cdot R^i-s^m\leq \sum_{i=1}^M C_{m,i}\cdot \check{R}^i,\forall m=1,...,M\\
-\sum_{i=1}^MC_{m,i}\cdot R^i-s^m\leq -\sum_{i=1}^M C_{m,i}\cdot \check{R}^i,\forall m=1,...,M\\
\sum_{m=1}^M (s^m)^2 \leq (\Gamma)^2
\end{matrix}$$
Ho letto che\sum_{i=1}^MC_{m,i}\cdot R^i-s^m\leq \sum_{i=1}^M C_{m,i}\cdot \check{R}^i,\forall m=1,...,M\\
-\sum_{i=1}^MC_{m,i}\cdot R^i-s^m\leq -\sum_{i=1}^M C_{m,i}\cdot \check{R}^i,\forall m=1,...,M\\
\sum_{m=1}^M (s^m)^2 \leq (\Gamma)^2
\end{matrix}$$
"gugo82":
invero fissati [tex]$x\in \ell^2$[/tex] ed [tex]$\varepsilon >0$[/tex] è possibile trovare [tex]$\nu\in \mathbb{N}$[/tex] in modo che [tex]\sum_{n=\nu +1}^{+\infty} |x_n|^2<\varepsilon^2[/tex] (poichè se la serie [tex]\sum |x_n|^2[/tex] è convergente, allora la successione dei resti [tex]r_N=\sum_{n=N}^{+\infty} |x_n|^2[/tex] è infinitesima), quindi posto [tex]$u=(x_1,\ldots ,x_\nu,0,\ldots ,0,\ldots )$[/tex] risulta
[tex]$\lVert x-u\rVert_2^2 =\sum_{n=\nu +1}^{+\infty} |x_n|^2<\varepsilon^2 \ \Rightarrow\ \lVert x-u\rVert_2<\varepsilon$[/tex]
ma non so se mi è utile. Potete aiutarmi?
Grazie