R e dati
Ciao a tutti, riposto la domanda che avevo messo in sezione economia:
Devo fare una serie di esercizi che riguardano l'elaborazione di dati con excel e rstudio
Ho una tabella di dati con due variabili (numero di clienti e profitti) di una serie di compagnie:
Devo quindi salvare tutto su excel e creare un file csv.
Fare il boxplot.
Poi devo caricare i dati in R e calcolare le statistiche di base per le due variabili.
Quindi confrontare la variabilità tra le due variabili e calcolare il coefficiente di correlazione.
Nel primo punto non ho problemi, il boxplot invece so farlo ma non capisco su quali dati devo crearlo perchè ho due variabili da 10 dati ciascuna (immagino che debba farlo su entrambe le serie da 10 e 10 in modo separato?)
Per quanto riguarda il caricare i dati in R non ho idea di come fare quindi mi servirebbe una mano...
Per confrontare la variabilità invece ho pensato di calcolare la varianza delle due distribuzioni e paragonarle.
E le statistiche di base??
Grazie rega spero in un aiuto
Devo fare una serie di esercizi che riguardano l'elaborazione di dati con excel e rstudio
Ho una tabella di dati con due variabili (numero di clienti e profitti) di una serie di compagnie:
Devo quindi salvare tutto su excel e creare un file csv.
Fare il boxplot.
Poi devo caricare i dati in R e calcolare le statistiche di base per le due variabili.
Quindi confrontare la variabilità tra le due variabili e calcolare il coefficiente di correlazione.
Nel primo punto non ho problemi, il boxplot invece so farlo ma non capisco su quali dati devo crearlo perchè ho due variabili da 10 dati ciascuna (immagino che debba farlo su entrambe le serie da 10 e 10 in modo separato?)
Per quanto riguarda il caricare i dati in R non ho idea di come fare quindi mi servirebbe una mano...
Per confrontare la variabilità invece ho pensato di calcolare la varianza delle due distribuzioni e paragonarle.
E le statistiche di base??
Grazie rega spero in un aiuto
Risposte
Per quanto riguarda i boxplot dipende dalla richiesta, immagino si, devi farne 2.
Per R puoi procedere in due modi:
Metodo 1
percorso=file.choose() # con questa funzione devi prendere il percorso del file csv da caricare
tabella=read.table(percorso, header=TRUE, sep=";",dec=",") # in questa funzione header=TRUE se nel file c'è un titolo, altrimenti metti FALSE, dec indica il separatore decimale nel caso in cui appunto usi la virgola e non il punto.
Metodo 2
tabella=read.table(file="qua scrivi il percorso completo del file csv che vuoi caricare", header=TRUE, sep=";",dec=",")
in entrambi i casi tabella conterrà le variabili che cercavi, tieni conto che poi puoi applicare mean(tabella) per fare media, sd(tabella) per farne la deviazione standard ecc ecc
Per R puoi procedere in due modi:
Metodo 1
percorso=file.choose() # con questa funzione devi prendere il percorso del file csv da caricare
tabella=read.table(percorso, header=TRUE, sep=";",dec=",") # in questa funzione header=TRUE se nel file c'è un titolo, altrimenti metti FALSE, dec indica il separatore decimale nel caso in cui appunto usi la virgola e non il punto.
Metodo 2
tabella=read.table(file="qua scrivi il percorso completo del file csv che vuoi caricare", header=TRUE, sep=";",dec=",")
in entrambi i casi tabella conterrà le variabili che cercavi, tieni conto che poi puoi applicare mean(tabella) per fare media, sd(tabella) per farne la deviazione standard ecc ecc
"matteo111":
Per quanto riguarda i boxplot dipende dalla richiesta, immagino si, devi farne 2.
Per R puoi procedere in due modi:
Metodo 1
percorso=file.choose() # con questa funzione devi prendere il percorso del file csv da caricare
tabella=read.table(percorso, header=TRUE, sep=";",dec=",") # in questa funzione header=TRUE se nel file c'è un titolo, altrimenti metti FALSE, dec indica il separatore decimale nel caso in cui appunto usi la virgola e non il punto.
Metodo 2
tabella=read.table(file="qua scrivi il percorso completo del file csv che vuoi caricare", header=TRUE, sep=";",dec=",")
in entrambi i casi tabella conterrà le variabili che cercavi, tieni conto che poi puoi applicare mean(tabella) per fare media, sd(tabella) per farne la deviazione standard ecc ecc
Ciao e grazie mille per la risposta intanto

Dato che questi concetti mi sono nuovi e non so praticamente nulla, l'idea che mi sono fatto è che devo scaricare il programma Rstudio che è un "prompt dei comandi" dove posso importare una tabella tipo quella dell'esercizio. E poi con questi comandi in linguaggio R posso fare calcoli sulle statistiche di questa tabella. Dico bene? E poi il box plot che mi chiede l'esercizio posso farlo anche quello su Rstudio con alcuni comandi?
Comunque credo di aver inteso quello che hai scritto

Tutto giusto, è molti intuitivo, scarica r studio e provaci