Dubbio su distribuzione asimmetrica

Shadow!
Ciao a tutti :) Studiando le distribuzioni unimodali asimmetriche positive, ho notato come fosse indicato che in tal caso intercorre tale relazione:
$ Md Tuttavia la definizione di asimmetria positiva mi dice anche che una distribuzione di questo tipo è più "prolungata" a destra rispetto alla mediana.
Interpretando la media aritmetica come il baricentro dei dati ho capito perché deve risultare necessariamente $ Me

Risposte
markowitz
Potresti esplicitare i termini coinvolti qui:

"Shock":

$ Md>Me>M $


inoltre
"Shock":

... ho capito perché deve risultare necessariamente $ Me>M $ ...

potresti spiegare il ragionamnento che hai fatto per capire ?

Shadow!
$ Md $ è la moda della distribuzione, $ M $ la media e $ Me $ la mediana. Ho corretto le relazioni nel primo messaggio dato che le avevo sbagliate.
Un esempio è questa immagine

Si nota come la mediana è inferiore alla media in quanto la mediana divide la distribuzione in due parti di uguale area, ed essendo la media il baricentro dei dati devi trovarsi più a destra, poiché devono essere bilanciati i prodotti tra aree e distanze. Dato che il grafico è più prolungato a destra, la media deve appunto trovarsi più a destra della mediana così che la parte a destra abbia un area inferiore a quella di sinistra ma questo viene poi bilanciato dal fatto che i dati a destra sono più distanti dalla media di quelli a sinistra.

Lo_zio_Tom
"Shock":
tuttavia invece non mi è chiaro perché deve risultare anche $ Md

La questione è cosa nota ma sono proprietà che di solito vengono date senza dimostrazione (almeno nei primi corsi di Statistica)

E' un problema che ti è stato chiesto di risolvere oppure è una tua (ragionevole) curiosità?

Se ne vuoi la dimostrazione occorre pensarci un po' su...ma non mi pare di facile soluzione (almeno in generale)

Se invece ti basta una verifica basta prendere un esempio di distribuzione unimodale asimmetrica (positiva o negativa) e te ne rendi conto immediatamente

Esempio

$f_X(x)-={{: ( 2/3x , ;0<=x<1 ),( 1-x/3 , ;1<=x<=3 ),( 0 , ; "altrove" ) :}$

disegna la distribuzione, verifica che è unimodale asimmetrica positiva e calcolane gli indici di posizione verificando le note proprietà:

$Moda"<"Mediana"<"Media"$ essendo

$1<3-sqrt(3)<4/3$

Per ciò che studi
"Shock":
Ciao a tutti! Mi chiamo Marco e frequento il primo anno di università (corso di studio: Statistica per l'azienda) :D


mi pare che questa spiegazione sia sufficiente.....IMHO

markowitz
Il tema dell'asimmetria in distribuzione mi interessa molto ma vi garantisco che è molto meno semplice di quanto possa sembrare a prima vista.

"tommik":
[quote="Shock"]tuttavia invece non mi è chiaro perché deve risultare anche $ Md

La questione è cosa nota ma sono proprietà che di solito vengono date senza dimostrazione (almeno nei primi corsi di Statistica)

E' un problema che ti è stato chiesto di risolvere oppure è una tua (ragionevole) curiosità?

Se ne vuoi la dimostrazione occorre pensarci un po' su...ma non mi pare di facile soluzione (almeno in generale)

[/quote]

Penso proprio che sia una curiosità di Shock. Il problema infatti è che una dimostrazione generale non esiste. Non può esistere perchè infatti è una "regola del pollice" che, in generale, può fallire!
La letteratura, manuali compresi, tratta in modo poco preciso questo punto e a volte gli autori commettono errori.

In particolare la relazione tra media e mediana è legata all'intuizione che Shock ha suggerito. Mi sembra l'intuizione giusta ed in un certo modo avevo anche provato a formalizzarla. Guardate qua:
viewtopic.php?f=34&t=154912&p=967112&hilit=asimmetria#p967112

Il problema è che però la relazione tra media e mediana è molto più problematica di quanto "l'intuizione" non lasci trapelare.
A questo proposito guardate qui:
https://en.wikipedia.org/wiki/Skewness# ... and_median

Per quanto riguarda la moda, caro Shock, una intuizione geometrica e/o probabilistica non l'ho intuita da me, e, pur cercando, non l'ho trovata da nessuna parte.
Forse, l'unico appiglio l'ho trovato proprio nell'articolo von Hippel, Paul T. (2005). "Mean, Median, and Skew: Correcting a Textbook Rule". Journal of Statistics Education. 13 (2) che è quello citato da Wikipedia.
E' ivi suggerito come per le distribuzioni continue ed unimodali le relazioni classiche tra media mediana e moda siano molto più difficili da cogliere in fallo rispetto alle distribuzioni discrete e/o multimodali. Tuttavia anche in quel sottoinsieme di casi non è impossibile farlo. Ergo, ripeto, una dimostrazione generale non esiste.
Tuttavia, in queste circostanze, si può intravedere un ruolo per la moda.

Inoltre bisognerebbe anche considerare che la media può non esistere.

Inotre i vari indici di simmetria (tema affine) presentano tutti qualche problema specifico e l'annullamento di nessuno di questi rappresenta condizione sufficiente per verfificare la presenza di simmetria.

Inoltre anche il significato stesso, la definizione, di simmetria andrebbe valutata attentamente. Spesso non è offerta. Ancora più spesso si adducono proprio le relazioni tra media mediana e moda, più o meno implicitamente, come definizione.
Ma purtroppo sarebbe una definizione ... almeno infelice.

"tommik":

Per ciò che studi
[quote="Shock"]Ciao a tutti! Mi chiamo Marco e frequento il primo anno di università (corso di studio: Statistica per l'azienda) :D

mi pare che questa spiegazione sia sufficiente.....IMHO[/quote]
in definitiva, è quello che penso anche io.

Se invece vi interessa approfondire, avevo suggerito una discussione anche qui:
https://stats.stackexchange.com/questio ... stribution
(che però è un forum che non mi piace)

Lo_zio_Tom
"markowitz":
Il tema dell'asimmetria in distribuzione mi interessa molto ma vi garantisco che è molto meno semplice di quanto possa sembrare a prima vista.


grazie per la spiegazione e per i link.

Shadow!
Grazie a tutti per le risposte! Sì, in realtà era una mia curiosità, in quanto ho tra poco l'orale dell'esame di Statistica e dunque potrebbero chiedermi come mai questo accade :)
Tuttavia questa "proprietà" non mi convinceva molto, ad esempio ho pensato ad una distribuzione del genere:
(ci sono anche le modalità 8 e 9 che non rientrano nell'immagine)
e in questa quella proprietà non viene rispettata, ma forse è a causa del fatto che è una distribuzione per un carattere discreto e non continuo :?

markowitz
In primis:
non penso che il tuo Prof. sia interessato a fare il sofisticato su questi aspetti. Probabilmente, se mai ti servirà all'esame, basta che ti ricordi la regola classica che hai esposto all'inizio.
(Consiglio: evita di giocare a fare il fenomeno all'esame :-) ).

Dopodichè:
non vorrei dare l'impressione che la regola in causa sia da buttare. Non è così. Ha la sua utilità ..., ma adrebbe sottolineato che possono esserci dei problemi. Troppo spesso non viene fatto. Entrare in questi problemi ... è roba per chi vuole un focus sul problema.

Per il resto:
Bravo. ;-)

In effetti, se non faccio errori nei conti, l'indice di asimmetria di Excel, che è poi quello più spesso utilizzato (momento terzo centrato e normalizzato) che è anche quello considerato da von Hippel nel suo articolo, è pari a $0,6086..$. Ovvero indicazione di asimmetria positiva.

Invece guardando media mediana e moda si avrebbe indicazione di asimmetria negativa. Ed è pure una distribuzione unimodale. :D

Tu cosa concluderesti?

Shadow!
A questo punto io penso che per determinare se la distribuzione è asimmetrica positivamente o negativamente bisognerebbe confrontare solamente la posizione di media e mediana, in quanto in quel caso c'è un motivo preciso se risultano essere in una determinata posizione in caso di asimmetria positiva/negativa.
Grazie a tutti per le risposte allora :D la moda la trascurerò :D

markowitz
La tua posizione mi sembra condivisibile. Infatti in uno dei link che ho messo c'è un mio tentativo di sviluppare quella strada.
Tuttavia ciò presuppone che il confronto tra le posizioni relative di media e mediana pongano le condizioni da addurre a definizione di simmetria; in effetti sembra che in alcuni testi questo sia il tacito approccio.

Tuttavia esiste anche la tendenza ad attribuire il significato di asimmetria negativa/positiva in base alla maggiore lunghezza della coda sinistra/destra. Il tutto senza definire in modo rigoroso questo concetto. Ad esempio in finanza è un’interpretazione tipica. Da qui l'uso del momento terzo e del collegato indice di Fisher e/o Pearson.

In generale esistono una moltitudine di indici di asimmetria in letteratura, ma nessuno è decisivo per determinare la presenza di simmetria. Tali indici sono validi solo in senso negativo, ovvero se non si annullano ... allora vi è asimmetria. Se si annullano la simmetria non è garantita. Se sono discordi nel segno, come sopra, si ha ambiguità.

Il problema vero, secondo me, è che bisognerebbe ricondursi ad una definizione esplicita chiara e condivisa di cosa significhi distribuzione simmetrica. Se cercate noterete che nella maggior parte dei testi essa non è offerta; si resta invece nel vago. Il diffondersi di una pluralità di indici potenzialmente in contraddizione è sintomatico della precedente considerazione.

La definizione di simmetria in distribuzione che mi sembra più convincente, almeno limitatamente alle distribuzioni continue, è del tipo $F(x*) = 1 – F(–x*)$ per ogni $x*$ dove $x*= x – med(X)$
L’indice di asimmetria di Bonferroni mi sembra sia quello che resta il più possibile "vicino" a questa definizione. Quindi, a mio parere, è l’indice da preferire.

Per chi è interessato ad approfondire:
Distribution-free test for symmetry based on Bonferroni's measure - Antonietta Mira; Journal of Applied Statistics.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.