Statistica e turismo

Bruno Palmero
Buongiorno a tutti,
apro questo mio primo post sperando di non porre domande (con risposte) impossibili.

In questo periodo sto valutando l'ipotesi di fare una proposta turistica (no-profit) al mio (piccolo) paese di residenza. L'idea sarebbe quella di analizzare i dati del turismo per poter capire qualcosa del suo andamento e proporre soluzioni valide.

Nel caso in esame non possiedo ancora i dati delle presenza turistiche ma credo che siano organizzati in questo modo
a) età del turista (da 0 a ... anni in modo discreto)
b) periodo della vacanza (ad esempio mese, varia da 1 a 12 in modo discreto)
c) durata della vacanza ( da 1 a ... giorni, varia in modo discreto)
d) nazionalità (da 1 a ..., varia in modo discreto perchè ad ogni numero naturale associo una nazionalità)

Ho studiato un po' il problema grazie al mio libro di statistica (Statistica per ingegneria, Montgomery Runger Hubele, ed, EGEA pg. 41-42-43-44) e ho visto che posso studiarlo mediante analisi statistica multivariata. Ho provveduto a trovare le correlazioni fra le varie coppie di valori costruendo una matrice contenente i coefficienti di correlazione (elementi sulla diagonale principale pari a 1 e elementi a(i,j) con termini i<>j pari al coefficiente di correlazione per la coppia in esame).

Ho poi proceduto a costruire la matrice dei diagrammi di dispersione. Tutto questo con excel e grazie a questo sito http://www.prodomosua.eu/ppage02.html (utility scatter).

Ecco le mie domande:
1) secondo voi ho proceduto in maniera corretta (tenuto conto che il turismo non è il mio argomento di lavoro)?
2) come dovrei fare se io volessi dare un punteggio al turista in funzione delle quattro variabili sopra riportate? Mi sono sempre chiesto come si possa dare un punteggio quantitativo (ad es. da 1 a 100) in funzione di diverse variabili in gioco. Come valuto i pesi delle diverse variabili? perchè esistono formule lineari, piuttosto che logaritmiche o esponenziali (come ad esempio nella valutazione dei punteggi dei lavori pubblici)?
3) se io volessi trovare una correlazione fra la durata della vacanza e l'età come dovrei procedere? Dovrei estrarre i dati relativi alla fascia d'età che voglio esaminare e ricalcolare la matrice dei diagrammi di dispersione?

E' possibile che i dati turistici non siano organizzati nel modo sopra indicato però sono comunque curioso di sapere se il problema è risolubile oppure no. In effetti mi piacerebbe sapere come studiare i dati e arrivare a sapere se esistono certe nazionalità in certi periodo dell'anno, oppure se certe nazionalità/età sono legate a certe durate della permanenza, etc.

Sperando di non aver sbagliato la sezione #-o
e
scusandomi in anticipo per la domanda "curiosa"
Saluti a tutti

Risposte
AntonioI1
Caro Bruno,
Per il punto 1) innanzitutto le correlazione vanno calcolate tra variabili quantitative e la d) sicuramente non la è, ed avrei anche qualche ritrosia nel calcolare la correlazione tra il mese b) e qualunque altra variabile.
Il punto 2) è di quanto più soggettivo possa esistere e dunque rischioso da vari punti di vista. Diciamo che è come valutare la qualità della vita. In ogni caso ti suggerirei di dare un'occhiata alle metodologie per la costruzione di indicatori statistici, ce ne sono davvero molte (ovviamente con vantaggi e svantaggi). Però, dovresti innanzitutto chiarire chi è per te il best tourist o il worst tourist e poi, probabilmente lavorare a ritroso. Ma veramente le soluzioni sono molteplici, metodologicamente parlando.
Punto 3) naturalmente intendi una correlazione i senso ampio. Io ti suggerisco di suddividere in classi di età ed in classi di durata della vacanza (brevi 1-3 giorni, 1 settimana, 2 settimane, più di due settimane, etc) e calcolare gli indici di associazione che ritieni più indicativi (rapporto di correlazione $\eta^2$ di Pearson, un $\chi^2$ chi quadro) o, perché no eseguire un'analisi delle corrispondenze binarie.

Bruno Palmero
Buongiorno,
innanzitutto mi scuso per non aver risposto prima perchè ho avuto una settimana piuttosto piena. Procedo quindi a ringraziarti per la risposta.
Sto ancora cercando di ottenere alcuni dati quindi credo che la mia idea andrà per le lunghe. Suddivido le risposte in funzione dei punti 1), 2) e 3) da me impiegati nel post iniziale.
1) Riguardo al problema delle correlazione fra variabili quantitative e non ho controllato sul libro di statistica che citavo in precedenza. Nell'esempio si parla di analisi statistica multivariata applicata ad un problema di... shampoo! Le variabili analizzate sono
a) schiuma
b) profumo
c) colore
d) residuo
e) regione
f) qualità
Le prime quattro variabili (descrittive) sono ottenute mediante un punteggio assegnato da persone preposte a quel compito (valore compreso fra 1 e 10). La variabile regione indica la zona degli stabilimenti presi in esame (valore 1 o 2, stabilimento dell'est e dell'ovest) mentre l'ultima è una valutazione dell'attrattività complessiva dello shampoo.
In questo esempio però va proprio a calcolare la correlazione a coppie fra le diverse variabili sopra citate.
2) Approfitto della presente per inviare un link per chi volesse costruire un indicatore statistico (http://eprints.unifi.it/archive/0000138 ... azioni.pdf): non credevo che fosse un argomento così complicato e forse, per il caso in esame, è un eccessivo ricorrere a questo strumento. Allego anche questo link per chi fosse interessato a indicatori statistici per il turismo http://www.slideshare.net/FormazioneTur ... el-turismo e qui per gli indicatori di turisticità http://www.ontit.it/opencms/opencms/ont ... ndex.html#.
3) Appena riesco a mettere le mani sui dati (e capire come sono fatti) mi metto all'opera.
Ti ringrazio per la risposta e per la cortesia.
Augurandoti buon week end,
Saluti

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.