Distribuzioni di probabilità e deformazioni spaziali
Supponiamo di avere due popolazioni di punti su un piano:
1) $m$ punti generati randomicamente da una distribuzione di probabilità $p(x,y)$
2) $n$ punti generati randomicamente da una distribuzione di probabilità $q(x,y)$
I domini in cui sono definite le due distribuzioni di probabilità hanno intersezione non vuota, e in generale possiamo assumere che siano definite su tutto il piano.
Preso un punto in una certa zona del piano, esiste una certa probabilità che appartenga ad una popolazione piuttosto che un'altra.
La domanda è:
È possibile, mediante una trasformazione di coordinate, massimizzare la "separazione" tra le due popolazioni? Ovvero fare in modo che preso un punto a caso, sia più facile stabilire a quale popolazione appartenga?
Il mio pronostico (non contiene dimostrazioni o idee risolutive):
1) $m$ punti generati randomicamente da una distribuzione di probabilità $p(x,y)$
2) $n$ punti generati randomicamente da una distribuzione di probabilità $q(x,y)$
I domini in cui sono definite le due distribuzioni di probabilità hanno intersezione non vuota, e in generale possiamo assumere che siano definite su tutto il piano.
Preso un punto in una certa zona del piano, esiste una certa probabilità che appartenga ad una popolazione piuttosto che un'altra.
La domanda è:
È possibile, mediante una trasformazione di coordinate, massimizzare la "separazione" tra le due popolazioni? Ovvero fare in modo che preso un punto a caso, sia più facile stabilire a quale popolazione appartenga?
Il mio pronostico (non contiene dimostrazioni o idee risolutive):
Risposte
Secondo me la sola ipotesi che l'intersezione dei due domini sia vuota è un ipotesi troppo debole per risolvere il problema.
Bisognerebbe avere qualche informazione extra sui domini, ad esempio sapere se sono limitati, se sono connessi ed in particolare se sono semplicemente connessi.
In ogni caso una qualunque trasformazione lineare si dimostra essere un isomorfismo, e un qualunque isomorfismo, purché chiaramente applicato ad entrambe le distribuzioni, non risolve il tuo problema perché per definizione la distanza relativa fra due punti rimane invariata. Poiché anche una trasformazione ortogonale (quindi una rotazione) è un isomorfismo anch'essa non risolve il tuo problema.
Per risolvere il tuo problema serve una trasformazione dipendente dalle coordinate, però poiché tale trasformazione dipende dalle coordinate diventa essenziale avere informazioni aggiuntive sulle proprietà topologiche dei due insiemi.
Ad esempio se sapessimo che i due insiemi sono entrambi semplicemente connessi, non si può verificare che un insieme "avvolga" l'altro (tipo un cerchio dentro una ciambella) ed inoltre sarebbero anche connessi quindi costituiti di un unico pezzo. Allora grazie alla sola ipotesi di essere semplicemente connessi(che implica di per se anche la connessione) esiste una curva $\gamma(t)$ che separa i due insiemi.
Quindi con un opportuno cambio di coordinate(cambio di base) si possono "simmetrizzare" i due insiemi rispetto a tale curva, che nella nuova base dovrà necessariamente essere una retta, tale retta dividerà $\RR^2$ in due semi piani che chiamiamo $A_1$ e $A_2$ a questo punto $\gamma(t)$ chiaramente separa ancora i due domini $D_1$ e $D_2$ e si avrà che essi sono contenuti rispettivamente uno nel primo l'altro nel secondo semipiano. Adesso il problema necessita di un altra ipotesi. O ci serve sapere ad esempio se i domini sono chiusi o aperti o nessuna delle due, oppure ci serve sapere se esistono dei valori di $t$ per cui la traccia della curva $\gamma(t)$ per tali valori è contenuta nella chiusura di uno dei due domini o in entrambi. In soldoni dobbiamo sapere se la curva che separa i due domini li separa "al pelo" o se li separa di un tot; equivalentemente ci potremmo chiedere se esiste un insieme aperto $G$ che contiene la curva $\gamma(t)$ la cui intersezione con almeno uno dei due domini è vuota. In tal caso esiste chiaramente una trasformazione che separa ulteriormente i due domini e tale trasformazione potrà essere banalmente una trasformazione definita come segue:
$$
T(x,y)= \begin{cases}I(x,y) \, se \, (x,y)\in A_1 \\ g(x,y) \, se \, (x,y)\in A_2\end{cases}
$$
questo se $G\cap A_2= \emptyset$ , dove con $I(x,y)$ ho indicato l'applicazione identità e con $g(x,y)$ ho indicato una generica trasformazione lineare, ad esempio la moltiplicazione per una costante. ovviamente non andrà bene qualunque applicazione lineare, andranno bene solo quelle che allontanano gli elementi di $D_2$ dalla retta separatrice dei due semi piani.
Questa è una possibile soluzione, ma sicuramente non è l'unica.
Quello che secondo me è certo è che sono indispensabili delle ipotesi supplementari sui due domini.
Spero di esserti stato d'aiuto.
Bisognerebbe avere qualche informazione extra sui domini, ad esempio sapere se sono limitati, se sono connessi ed in particolare se sono semplicemente connessi.
In ogni caso una qualunque trasformazione lineare si dimostra essere un isomorfismo, e un qualunque isomorfismo, purché chiaramente applicato ad entrambe le distribuzioni, non risolve il tuo problema perché per definizione la distanza relativa fra due punti rimane invariata. Poiché anche una trasformazione ortogonale (quindi una rotazione) è un isomorfismo anch'essa non risolve il tuo problema.
Per risolvere il tuo problema serve una trasformazione dipendente dalle coordinate, però poiché tale trasformazione dipende dalle coordinate diventa essenziale avere informazioni aggiuntive sulle proprietà topologiche dei due insiemi.
Ad esempio se sapessimo che i due insiemi sono entrambi semplicemente connessi, non si può verificare che un insieme "avvolga" l'altro (tipo un cerchio dentro una ciambella) ed inoltre sarebbero anche connessi quindi costituiti di un unico pezzo. Allora grazie alla sola ipotesi di essere semplicemente connessi(che implica di per se anche la connessione) esiste una curva $\gamma(t)$ che separa i due insiemi.
Quindi con un opportuno cambio di coordinate(cambio di base) si possono "simmetrizzare" i due insiemi rispetto a tale curva, che nella nuova base dovrà necessariamente essere una retta, tale retta dividerà $\RR^2$ in due semi piani che chiamiamo $A_1$ e $A_2$ a questo punto $\gamma(t)$ chiaramente separa ancora i due domini $D_1$ e $D_2$ e si avrà che essi sono contenuti rispettivamente uno nel primo l'altro nel secondo semipiano. Adesso il problema necessita di un altra ipotesi. O ci serve sapere ad esempio se i domini sono chiusi o aperti o nessuna delle due, oppure ci serve sapere se esistono dei valori di $t$ per cui la traccia della curva $\gamma(t)$ per tali valori è contenuta nella chiusura di uno dei due domini o in entrambi. In soldoni dobbiamo sapere se la curva che separa i due domini li separa "al pelo" o se li separa di un tot; equivalentemente ci potremmo chiedere se esiste un insieme aperto $G$ che contiene la curva $\gamma(t)$ la cui intersezione con almeno uno dei due domini è vuota. In tal caso esiste chiaramente una trasformazione che separa ulteriormente i due domini e tale trasformazione potrà essere banalmente una trasformazione definita come segue:
$$
T(x,y)= \begin{cases}I(x,y) \, se \, (x,y)\in A_1 \\ g(x,y) \, se \, (x,y)\in A_2\end{cases}
$$
questo se $G\cap A_2= \emptyset$ , dove con $I(x,y)$ ho indicato l'applicazione identità e con $g(x,y)$ ho indicato una generica trasformazione lineare, ad esempio la moltiplicazione per una costante. ovviamente non andrà bene qualunque applicazione lineare, andranno bene solo quelle che allontanano gli elementi di $D_2$ dalla retta separatrice dei due semi piani.
Questa è una possibile soluzione, ma sicuramente non è l'unica.
Quello che secondo me è certo è che sono indispensabili delle ipotesi supplementari sui due domini.
Spero di esserti stato d'aiuto.

Vorrei aggiungere anche un'altra osservazione.
Secondo me è scontato che se non vi è alcuna richiesta di continuità sulla deformazione scelta o se non si chiede che questa sia un omotopia allora la risposta al tuo quesito è chiaramente SI e questo indipendentemente dalle proprietà topologiche dei due domini, anche se essi fossero insiemi frattali!
Questo per il semplice fatto che senza condizioni sulla mia trasformazione io posso sempre spostare ogni elemento del piano in un altro punto che mi pare e piace a me, ad esempio due insiemi che non si intersecavano posso far si che si intersechino; è chiaro che tali trasformazioni probabilmente non avranno un espressione "scrivibile" nel senso comune, e sopratutto non avranno alcuna proprietà in particolare.
Perciò una trasformazione del genere anche una volta trovata per quei due domini in particolare sarà inutile cambiando domini.
Banalmente posso definire per lo scopo una trasformazione definita come segue
$$
T(x,y)=\begin{cases}(x,y)-(k,k) \, se \, (x,y)\in D_1 \\ (x,y)+(k,k) \,se\, (x,y) \in D_2\\ (x,y) \,se\, (x,y)\in R^2-D_1-D_2\end{cases}
$$
è chiaro che tale trasformazione definita su tutto $\R^2$ separa i due domini per $k$ sufficientemente grande, però è priva di utilità perché è definita in maniera non costruttiva, nel senso che necessito di sapere a priori esattamente quali sono i punti dei due domini e da come hai posto la domanda pare che a priori questo non si sappia, inoltre per la maggior parte dei domini sarà discontinua.
Quindi tutto il mio precedente discorso chiaramente era basato sull'assunzione di voler fare se non una trasformazione continua, almeno una trasformazione passami di nuovo il termine "scrivibile".
Inoltre per sottolineare il mio punto, immagina che i due domini abbiamo la forma di uno yin e yang, e supponiamo lo yin chiuso e lo yang aperto. Dove se hai in mente il disegno lo yin è tutta la parte nera e lo yang tutta la parte bianca.
In questo caso i due domini hanno intersezione nulla, ma ad esempio non sono ne semplicemente connessi ne tanto meno connessi.
In questo caso non è possibile applicare allo spazio una trasformazione che non sia discontinua e che risolva il tuo problema.
Come puoi notare un ipotesi molto importante per avere una soluzione continua è quella di sapere se esistono o meno punti dello spazio in cui i due domini sono contigui; ed in tali punti (se esistono) la soluzione non potrà essere continua.
Come puoi notare sono infiniti i casi di cui si può discutere, la contiguità ad esempio sembra essere fondamentale, ma probabilmente è fondamentale per quegli insiemi formati dall'unione finita di pezzi. Nel caso di domini più complicati (come domini formati da unioni infinite di pezzi) e probabilmente non disegnabili, anche l'ipotesi di contiguità potrebbe non essere più necessaria, ma potrebbero diventare necessarie altre ipotesi tipo la chiusura o l'apertura dei domini.
Secondo me è scontato che se non vi è alcuna richiesta di continuità sulla deformazione scelta o se non si chiede che questa sia un omotopia allora la risposta al tuo quesito è chiaramente SI e questo indipendentemente dalle proprietà topologiche dei due domini, anche se essi fossero insiemi frattali!
Questo per il semplice fatto che senza condizioni sulla mia trasformazione io posso sempre spostare ogni elemento del piano in un altro punto che mi pare e piace a me, ad esempio due insiemi che non si intersecavano posso far si che si intersechino; è chiaro che tali trasformazioni probabilmente non avranno un espressione "scrivibile" nel senso comune, e sopratutto non avranno alcuna proprietà in particolare.
Perciò una trasformazione del genere anche una volta trovata per quei due domini in particolare sarà inutile cambiando domini.
Banalmente posso definire per lo scopo una trasformazione definita come segue
$$
T(x,y)=\begin{cases}(x,y)-(k,k) \, se \, (x,y)\in D_1 \\ (x,y)+(k,k) \,se\, (x,y) \in D_2\\ (x,y) \,se\, (x,y)\in R^2-D_1-D_2\end{cases}
$$
è chiaro che tale trasformazione definita su tutto $\R^2$ separa i due domini per $k$ sufficientemente grande, però è priva di utilità perché è definita in maniera non costruttiva, nel senso che necessito di sapere a priori esattamente quali sono i punti dei due domini e da come hai posto la domanda pare che a priori questo non si sappia, inoltre per la maggior parte dei domini sarà discontinua.
Quindi tutto il mio precedente discorso chiaramente era basato sull'assunzione di voler fare se non una trasformazione continua, almeno una trasformazione passami di nuovo il termine "scrivibile".
Inoltre per sottolineare il mio punto, immagina che i due domini abbiamo la forma di uno yin e yang, e supponiamo lo yin chiuso e lo yang aperto. Dove se hai in mente il disegno lo yin è tutta la parte nera e lo yang tutta la parte bianca.
In questo caso i due domini hanno intersezione nulla, ma ad esempio non sono ne semplicemente connessi ne tanto meno connessi.
In questo caso non è possibile applicare allo spazio una trasformazione che non sia discontinua e che risolva il tuo problema.
Come puoi notare un ipotesi molto importante per avere una soluzione continua è quella di sapere se esistono o meno punti dello spazio in cui i due domini sono contigui; ed in tali punti (se esistono) la soluzione non potrà essere continua.
Come puoi notare sono infiniti i casi di cui si può discutere, la contiguità ad esempio sembra essere fondamentale, ma probabilmente è fondamentale per quegli insiemi formati dall'unione finita di pezzi. Nel caso di domini più complicati (come domini formati da unioni infinite di pezzi) e probabilmente non disegnabili, anche l'ipotesi di contiguità potrebbe non essere più necessaria, ma potrebbero diventare necessarie altre ipotesi tipo la chiusura o l'apertura dei domini.
Grazie per i dettagli. Sostanzialmente mi serviva capire se poteva avere un senso un simile approccio in applicazioni pratiche, quindi con ipotesi di connessione dei domini. I domini non hanno però intersezione vuota. Quindi l'obiettivo era anche ridurre l'intersezione, eventualmente sfruttando proiezioni in dimensioni aggiuntive. La parte interessante da questo punto di vista è che sono necessarie trasformazioni dipendenti dalle coordinate.
Secondo il mio parere è estremamente interessante, però se i domini non hanno intersezione vuota, allora non è risolubile con una trasformazione continua, ed è probabilmente insolubile in generale...
Cerca di capire di quali proprietà vuoi che godano i tuoi domini, una volta chiare le ipotesi possiamo cercare qualche soluzione al problema.
Cerca di capire di quali proprietà vuoi che godano i tuoi domini, una volta chiare le ipotesi possiamo cercare qualche soluzione al problema.