Normalizzazione Vettore
Ciao a tutti,
mi trovo a sottoporvi un problema in quanto è un po che ci sto impazzendo e dato che dovrebbe essere una cosa 'semplice' non dovrei perderci più di molto tempo.
In pratica io ho un vettore di dati interi (e alcuni si ripetono) e dovrei normalizzarli in modo da avere una distribuzione con media nulla e varianza unitaria.
L'insieme dei dati, riportando in ascissa il valore e in ordinata il numero di ripetizioni, assomiglia ad una distribuzione normale.
Questi dati, una volta normalizzati devono essere dati in pasto ad un programma che accetta come intervallo [-1,1].
Ora il mio problema è il seguente, ho calcolato media, varianza e deviazione standard, ma non riesco a trasformare il mio insieme in un insieme che mi porti al risultato di una distribuzione normale.
Non so se si capisce bene il problema, quindi vi metto il grafico risultante dai dati in ingresso di uno degli insiemi che dovrei processare. Le ascisse vanno da 65 a 103 (ci son molti dati mancanti e la scala non è lineare). In ordinata invece ci sono precisi il numero di ripetizioni dei dati.
Grafico Data#0
Se ancora non si capisce posso entrare ancora più nei dettagli, ma spero sia chiaro.
Grazie in anticipo!
Claudio
PS: scusate l'ora del post :D
mi trovo a sottoporvi un problema in quanto è un po che ci sto impazzendo e dato che dovrebbe essere una cosa 'semplice' non dovrei perderci più di molto tempo.
In pratica io ho un vettore di dati interi (e alcuni si ripetono) e dovrei normalizzarli in modo da avere una distribuzione con media nulla e varianza unitaria.
L'insieme dei dati, riportando in ascissa il valore e in ordinata il numero di ripetizioni, assomiglia ad una distribuzione normale.
Questi dati, una volta normalizzati devono essere dati in pasto ad un programma che accetta come intervallo [-1,1].
Ora il mio problema è il seguente, ho calcolato media, varianza e deviazione standard, ma non riesco a trasformare il mio insieme in un insieme che mi porti al risultato di una distribuzione normale.
Non so se si capisce bene il problema, quindi vi metto il grafico risultante dai dati in ingresso di uno degli insiemi che dovrei processare. Le ascisse vanno da 65 a 103 (ci son molti dati mancanti e la scala non è lineare). In ordinata invece ci sono precisi il numero di ripetizioni dei dati.
Grafico Data#0
Se ancora non si capisce posso entrare ancora più nei dettagli, ma spero sia chiaro.
Grazie in anticipo!
Claudio
PS: scusate l'ora del post :D
Risposte
Indico con $a_n$ con $n=1,2,3,...$ i tuoi dati.
Per ogni "n" fai la seguente trasformazione:
$(a_n-\mu)/sigma$ con $n=1,2.3....$
dove $\mu$ è il valore atteso che hai trovato e $\sigma$ è la radice quadrata della varianza.
Per ogni "n" fai la seguente trasformazione:
$(a_n-\mu)/sigma$ con $n=1,2.3....$
dove $\mu$ è il valore atteso che hai trovato e $\sigma$ è la radice quadrata della varianza.