Errore in R cluster analysis
Ciao a tutti,
vorrei eseguire una cluster analysis in R.
Quando provo a calcolare la matrice delle distante, mi restituisce il seguente errore:
La struttura del dataset è la seguente
Ho pensato che l'errore possa essere la variabile link che è un factor.
Però anche se scrivo
mi viene comunque restituito il messaggio di errore...Come posso risolvere il problema?Grazie
Con dist vorrei ottenere una matrice 290x290, in cui nella diagonale c'è 0 mentre all'esterno la distanza euclidea...
Ho provato a cercare ovunque una soluzione, il problema è lo stesso di questo utente http://thr3ads.net/r-help/2007/05/89061 ... on-in-dist che non è arrivato alla soluzione..
vorrei eseguire una cluster analysis in R.
Quando provo a calcolare la matrice delle distante, mi restituisce il seguente errore:
x<-read.csv("z:/risultatofinale.csv" , sep=",", header=T) d <- dist(x, method = "euclidean") Warning message: In dist(x, method = "euclidean") : si è prodotto un NA per coercizione
La struttura del dataset è la seguente
'data.frame': 290 obs. of 30 variables: $ link : Factor w/ 290 levels "3s-ski.de","ad.it.doubleclick.net",..: 1 2 3 4 5 6 7 8 9 10 ... $ HomePage : int 0 0 3 0 0 0 0 0 20 0 ... $ SectionHomePage : int 0 1 0 3 6 1 12 7 12 7 ... $ SectionSubPage : int 9 0 0 23 4 2 0 4 48 7 ... $ pagebody : int 5 0 0 0 2 0 0 0 20 0 ... $ lateral : int 4 1 3 0 8 3 12 11 40 0 ... $ footer : int 0 0 0 26 0 0 0 0 0 0 ... $ background : int 0 0 0 0 0 0 0 0 20 0 ... $ header : int 0 0 0 0 0 0 0 0 0 14 ... $ popup : int 0 0 0 0 0 0 0 0 0 0 ... $ AbbigliamentoSportivo: int 9 0 0 0 0 0 0 0 0 0 ... $ Moda : int 0 1 0 0 0 0 12 0 0 0 ... $ BellezzaMakeUp : int 0 0 3 0 0 0 0 0 0 0 ... $ Bellezza : int 0 0 0 26 10 3 0 0 0 0 ... $ BellezzaSkincare : int 0 0 0 0 0 0 0 11 0 0 ... $ Orologi : int 0 0 0 0 0 0 0 0 80 0 ... $ Auto : int 0 0 0 0 0 0 0 0 0 14 ... $ Calzature : int 0 0 0 0 0 0 0 0 0 0 ... $ Borse : int 0 0 0 0 0 0 0 0 0 0 ... $ Gioielli : int 0 0 0 0 0 0 0 0 0 0 ... $ Arredamento : int 0 0 0 0 0 0 0 0 0 0 ... $ Accessori : int 0 0 0 0 0 0 0 0 0 0 ... $ Intimo : int 0 0 0 0 0 0 0 0 0 0 ... $ ModaBambino : int 0 0 0 0 0 0 0 0 0 0 ... $ Profumi : int 0 0 0 0 0 0 0 0 0 0 ... $ Occhiali : int 0 0 0 0 0 0 0 0 0 0 ... $ Outlet : int 0 0 0 0 0 0 0 0 0 0 ... $ Fiere : int 0 0 0 0 0 0 0 0 0 0 ... $ Costumi : int 0 0 0 0 0 0 0 0 0 0 ... $ Sondaggi : int 0 0 0 0 0 0 0 0 0 0 ...
Ho pensato che l'errore possa essere la variabile link che è un factor.
Però anche se scrivo
options(stringsAsFactors = FALSE) x<-read.csv("z:/risultatofinale.csv" , sep=",", header=T) d <- dist(x, method = "euclidean") Warning message: In dist(x, method = "euclidean") : si è prodotto un NA per coercizione
mi viene comunque restituito il messaggio di errore...Come posso risolvere il problema?Grazie

Con dist vorrei ottenere una matrice 290x290, in cui nella diagonale c'è 0 mentre all'esterno la distanza euclidea...
Ho provato a cercare ovunque una soluzione, il problema è lo stesso di questo utente http://thr3ads.net/r-help/2007/05/89061 ... on-in-dist che non è arrivato alla soluzione..
Risposte
La prima opzione che mi hai suggerito è quella che è adatta per il mio caso, grazie mille Sergio!

Buongiorno e scusate se mi intrometto nella conversazione. Io devo utilizzare R per calcolare l'indice di Gower e sono alle prime armi con questo software, avete qualche consiglio, suggerimento o qualche comando che potrebbe essermi utile?
Ho un data set di 10.000 record con variabili miste.
Ho un data set di 10.000 record con variabili miste.