Clustering
Salve a tutti!
Dal qualche tempo ho dovuto iniziare ad interessarmi di statistica per lavoro e ho bisogno di un aiuto per capire bene che tipologia di clustering (sempre che di clustering si tratti!!)è stata utilizzata per creare un grafico come questo.

Le aree colorate corrispondono a dati di ricerche precedenti su cui sono sati plottati i dati di una nuova ricerca.
Allora: da quanto sono riuscito a capire, vista mia assoluta ignoranza, non si tratta di un'analisi fattoriale, visto che sugli assi ho dei valori reali(cioè che corrispondono ad un rapporto tra elementi chimici) e non valori aleatori (se non sbaglio si dovrebbero chiamare così) tipo 2, 1,0,-1,-2 etc.
Ho pensato sia una cluster analisys, dove sono stati raggruppati i campioni simili tra loro, ma non sono riuscito ad ottenere quelle aree che tra l'altro hanno anche una forma irregolare e non ellittica come vedo nei tanti esempi in rete.
Avete dei suggerimenti da darmi?
Grazie!!
Dal qualche tempo ho dovuto iniziare ad interessarmi di statistica per lavoro e ho bisogno di un aiuto per capire bene che tipologia di clustering (sempre che di clustering si tratti!!)è stata utilizzata per creare un grafico come questo.

Le aree colorate corrispondono a dati di ricerche precedenti su cui sono sati plottati i dati di una nuova ricerca.
Allora: da quanto sono riuscito a capire, vista mia assoluta ignoranza, non si tratta di un'analisi fattoriale, visto che sugli assi ho dei valori reali(cioè che corrispondono ad un rapporto tra elementi chimici) e non valori aleatori (se non sbaglio si dovrebbero chiamare così) tipo 2, 1,0,-1,-2 etc.
Ho pensato sia una cluster analisys, dove sono stati raggruppati i campioni simili tra loro, ma non sono riuscito ad ottenere quelle aree che tra l'altro hanno anche una forma irregolare e non ellittica come vedo nei tanti esempi in rete.
Avete dei suggerimenti da darmi?
Grazie!!
Risposte
Ti scrivo qualche punto da prendere con le pinze, visto che la cosa più importante è come ci si arriva ad una rappresentazione grafica, qui non se ne sa nulla.
- Analisi fattoriale e Analisi dei gruppi non si escludono, non conosco le unità di misura del grafico, ma non è detto che non siano fattori.
- La tipica forma ellissoidale del raggruppamento, in genere, deriva da metodi di clustering che utilizzano i centroidi. Non sempre si utilizzano questi metodi ed il ricercatore può anche, discrezionalmente, tracciare delle aree arbitrarie. In ogni caso nel grafico sembrano essere stati individuati 4 gruppi (quelli cerchiati). Le aree grandi di sfondo potrebbero essere solo dei riferimenti.
- Il fatto che i gruppi si sovrappongano mi fa pensare ad una proiezione di più dimensioni (che potrebbero tranquillamente essere fattori) sul piano, ma è solo una mia ipotesi. In quest'ultimo caso anche le aree di sfondo potrebbero essere interpretate come una proiezione di una nuvola di dati delle ricerche precedenti, questo spiegherebbe la forma irregolare.
- Analisi fattoriale e Analisi dei gruppi non si escludono, non conosco le unità di misura del grafico, ma non è detto che non siano fattori.
- La tipica forma ellissoidale del raggruppamento, in genere, deriva da metodi di clustering che utilizzano i centroidi. Non sempre si utilizzano questi metodi ed il ricercatore può anche, discrezionalmente, tracciare delle aree arbitrarie. In ogni caso nel grafico sembrano essere stati individuati 4 gruppi (quelli cerchiati). Le aree grandi di sfondo potrebbero essere solo dei riferimenti.
- Il fatto che i gruppi si sovrappongano mi fa pensare ad una proiezione di più dimensioni (che potrebbero tranquillamente essere fattori) sul piano, ma è solo una mia ipotesi. In quest'ultimo caso anche le aree di sfondo potrebbero essere interpretate come una proiezione di una nuvola di dati delle ricerche precedenti, questo spiegherebbe la forma irregolare.
Ti ringrazio infinitamente per la risposta che attendevo con ansia già da ieri....
Quello di cui sono sicuro è che non si tratta di fattori, ma di rapporti delle concentrazioni di alcuni elementi chimici rilevati in tracce; questo sono riuscito a ricavarlo da alcune tabelle riportate nell'articolo dove sono indicate le concentrazioni stesse. Ad esempio, se il campione A è plottato nel grafico in A(2;3) nella tabella vi è indicato, in ppm, Y=2, Nb= 4, Zr= 6.
Da quanto sono riuscito a capire dalla tua risposta si potrebbe quindi trattare di un clustering che utilizza i medioidi?
grazie!
Quello di cui sono sicuro è che non si tratta di fattori, ma di rapporti delle concentrazioni di alcuni elementi chimici rilevati in tracce; questo sono riuscito a ricavarlo da alcune tabelle riportate nell'articolo dove sono indicate le concentrazioni stesse. Ad esempio, se il campione A è plottato nel grafico in A(2;3) nella tabella vi è indicato, in ppm, Y=2, Nb= 4, Zr= 6.
Da quanto sono riuscito a capire dalla tua risposta si potrebbe quindi trattare di un clustering che utilizza i medioidi?
grazie!
Da quanto sono riuscito a capire dalla tua risposta si potrebbe quindi trattare di un clustering che utilizza i medioidi?
Potrebbe essere, potrebbe essere un metodo di fuzzy clustering visto che i gruppi si sovrappongono. Più realisticamente credo sia un raggruppamento a priori, ovvero il ricercatore ha raggruppato gli elementi secondo un suo criterio per poi vedere come si posizionavano sul grafico (quindi escludo metodi di clustering). Le aree dei gruppi del grafico servirebbero come confronto per altre rilevazioni. Capirlo unicamente dal grafico è per me difficile perché come dicevo, l'importante e sapere come ci si arriva ad una rappresentazione di questo tipo e che cosa vorrebbe comunicare.
Ok. Grazie infinite per il contributo.