Errore in R cluster analysis

valeriaaa11
Ciao a tutti,
vorrei eseguire una cluster analysis in R.
Quando provo a calcolare la matrice delle distante, mi restituisce il seguente errore:

 x<-read.csv("z:/risultatofinale.csv" , sep=",", header=T)
 d <- dist(x, method = "euclidean")
Warning message:
 In dist(x, method = "euclidean") : si è prodotto un NA per coercizione


La struttura del dataset è la seguente

'data.frame':   290 obs. of  30 variables:
 $ link                 : Factor w/ 290 levels "3s-ski.de","ad.it.doubleclick.net",..: 1 2 3 4 5 6 7 8 9 10 ...
 $ HomePage             : int  0 0 3 0 0 0 0 0 20 0 ...
 $ SectionHomePage      : int  0 1 0 3 6 1 12 7 12 7 ...
 $ SectionSubPage       : int  9 0 0 23 4 2 0 4 48 7 ...
 $ pagebody             : int  5 0 0 0 2 0 0 0 20 0 ...
 $ lateral              : int  4 1 3 0 8 3 12 11 40 0 ...
 $ footer               : int  0 0 0 26 0 0 0 0 0 0 ...
 $ background           : int  0 0 0 0 0 0 0 0 20 0 ...
 $ header               : int  0 0 0 0 0 0 0 0 0 14 ...
 $ popup                : int  0 0 0 0 0 0 0 0 0 0 ...
 $ AbbigliamentoSportivo: int  9 0 0 0 0 0 0 0 0 0 ...
 $ Moda                 : int  0 1 0 0 0 0 12 0 0 0 ...
 $ BellezzaMakeUp       : int  0 0 3 0 0 0 0 0 0 0 ...
 $ Bellezza             : int  0 0 0 26 10 3 0 0 0 0 ...
 $ BellezzaSkincare     : int  0 0 0 0 0 0 0 11 0 0 ...
 $ Orologi              : int  0 0 0 0 0 0 0 0 80 0 ...
 $ Auto                 : int  0 0 0 0 0 0 0 0 0 14 ...
 $ Calzature            : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Borse                : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Gioielli             : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Arredamento          : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Accessori            : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Intimo               : int  0 0 0 0 0 0 0 0 0 0 ...
 $ ModaBambino          : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Profumi              : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Occhiali             : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Outlet               : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Fiere                : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Costumi              : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Sondaggi             : int  0 0 0 0 0 0 0 0 0 0 ...


Ho pensato che l'errore possa essere la variabile link che è un factor.

Però anche se scrivo

options(stringsAsFactors = FALSE)
 x<-read.csv("z:/risultatofinale.csv" , sep=",", header=T)
 d <- dist(x, method = "euclidean")
Warning message:
 In dist(x, method = "euclidean") : si è prodotto un NA per coercizione


mi viene comunque restituito il messaggio di errore...Come posso risolvere il problema?Grazie :)

Con dist vorrei ottenere una matrice 290x290, in cui nella diagonale c'è 0 mentre all'esterno la distanza euclidea...
Ho provato a cercare ovunque una soluzione, il problema è lo stesso di questo utente http://thr3ads.net/r-help/2007/05/89061 ... on-in-dist che non è arrivato alla soluzione..

Risposte
valeriaaa11
La prima opzione che mi hai suggerito è quella che è adatta per il mio caso, grazie mille Sergio! :smt023

Enrico Boscolo
Buongiorno e scusate se mi intrometto nella conversazione. Io devo utilizzare R per calcolare l'indice di Gower e sono alle prime armi con questo software, avete qualche consiglio, suggerimento o qualche comando che potrebbe essermi utile?
Ho un data set di 10.000 record con variabili miste.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.