H clustering: calcolo degli indici R^2 e RMSSTD

Studente Anonimo
Studente Anonimo
Salve. Volevo sapere se esiste all'interno del software di statistica R la possibilità di calcolare gli indici R e RMSSTD che servono per valutare la bontà della partizione nei metodi gerarchici di clustering in modo da sapere quale è la migliore da scegliere tra tutte quelle che si formano nel corso delle successive aggregazioni.
Cioè in poche parole se esiste una riga di comando che si può scrivere da consolle per dire al software di calcolare questi indici in modo da sapere dove fermarmi nel taglio del dendrogramma.
Cioè in poche parole vorrei sapere se sia possibile calcolare per ogni partizione del dendrogramma i due indici senza dovere impostare un calcolo a mano oppure con un foglio elettronico ad esempio.
Per il significato dei due indici, si può leggere questo link alle pagine 44 e 45.
http://www.economia.unict.it/web/apunzo/Materiale_Didattico/fa_analisi_dati/Lezione3.pdf
Grazie.
Ciao.

Risposte
Studente Anonimo
Studente Anonimo
Capisco che evidentemente non è un argomento facile. o di pubblico dominio. Allora cambio domanda.
Ad un certo punto gli indici come da titolo posso calcolarli mediante il foglio elettronico. Ma se non ho le partizioni ai diversi passi non posso. Allora mi chiedo se posso, sempre con R, ottenere la successione delle partizioni associate al dendrogramma che ho plottato con uno script.
Cioè, a partire dal dendrogramma, posso riuscire ad ottenere le partizioni che si formano ai vari passi in modo che io possa con il foglio elettronico calcolarmi gli indici R2 e RMSSTD. La domanda non è banale perché il dataset che ho è enorme (più di 100 osservazioni) e il grafico che io ottengo è un dendrogramma in cui separare i diversi cluster risulta problematico. Cioè capire quali cluster si sono formati ai diversi livelli della costruzione.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.