Valor medio e media
Mi servirebbero alcune chiarificazioni su alcune definizioni basi della statistica/probabilità: non dispongo di nessun corso di statistica ma un almeno alcuni concetti base dovrei ora acquisirli per trattare alcune materie che ne fanno uso (anche e in piccolo parte richiamando i concetti base)...
Il mio libro di fisica prima di trattare i vari concetti tende sempre a fare dei richiami matematici relativi al capitolo che si affronterà:
ora in uno di questi introduce il concetto di MEDIA o VALORE MEDIO:
$ =sum_(j = 1,\ldots,n) x_jp_j $
poi mi parla subito dopo di un "secondo momento della distribuzione $ {p_j} $ " cosi definito:
$ = sum_(j =1, \ldots,n) (x_j)^2p_j $
n.b: di tale quantità non i dice nulla, nel senso che non mi spiega cos'è...ma ovviamente penso sia difficile trovare un significato concreto in tale formula e penso sia piu una grandezza operativa per deifnire altre grandezze/quantità piu importanti come il "secondo momento centrale o VARIANZA:
$ (sigma _x)^2=<(x-)^2> =sum_(j = 1,\ldots,n) (x_j- )^2p_j $
mi parla in fine i DEVIAZIONE STANDARD $ sigma=sqrtsigma^2 $ .
Formule simile poi ci sono per il caso continuo,con l'integrale che sostituisce il simbolo di sommatoria.
IL PUNTO è che ho guardato un po' anche su internet per capire il loro significato concreto e operativo ma ho trovato una diversa formulazione di valor medio,momento secondo della distribuzione,varianza e deviazione standard !!
ad esempio il valore medio l'ho trovato anche cosi espresso:
$ bar(x) =(x_1+x_2+...+x_n)/n=1/n*sum_(i = 1\ldots,n) x_i $
(che mi pare non sia altro che la media aritmetica.)
Associato a ciò ho trovato ad aesempio la varianza cosi espressa:
$ sigma^2=1/n*sum_(i =1, \ldots,n) (x_i-bar(x) _i)^2 $
e similmente per la deviazione standard
Mi chiedo allora cosa cambia tra le varie forme?
Se si parla di valor medio a quale delle due si fa riferimento di solito? a entrambe(dipende dalla situazione)?
Inoltre se considero la seconda definizione di valor medio , $ bar(x) $ , posso dire affermare che il "valor medio" coincide con la media a stessa di quel campione di dati? Quindi parlare di media o di valor medio è indiferente?
Mi scuso in anticipo se per alcuni possono essere concetti banali ma io non ho frequentato nessun corso di statistica o affine e perciò sono un po' tutti concetti estranei.
Se qualcuno può darmi una mano chiarendomi le idee su questi concetti e spiegandomi la differenza se c'è tra le due interpretazioni...grazie!!
Il mio libro di fisica prima di trattare i vari concetti tende sempre a fare dei richiami matematici relativi al capitolo che si affronterà:
ora in uno di questi introduce il concetto di MEDIA o VALORE MEDIO:
$
poi mi parla subito dopo di un "secondo momento della distribuzione $ {p_j} $ " cosi definito:
$
n.b: di tale quantità non i dice nulla, nel senso che non mi spiega cos'è...ma ovviamente penso sia difficile trovare un significato concreto in tale formula e penso sia piu una grandezza operativa per deifnire altre grandezze/quantità piu importanti come il "secondo momento centrale o VARIANZA:
$ (sigma _x)^2=<(x-
mi parla in fine i DEVIAZIONE STANDARD $ sigma=sqrtsigma^2 $ .
Formule simile poi ci sono per il caso continuo,con l'integrale che sostituisce il simbolo di sommatoria.
IL PUNTO è che ho guardato un po' anche su internet per capire il loro significato concreto e operativo ma ho trovato una diversa formulazione di valor medio,momento secondo della distribuzione,varianza e deviazione standard !!
ad esempio il valore medio l'ho trovato anche cosi espresso:
$ bar(x) =(x_1+x_2+...+x_n)/n=1/n*sum_(i = 1\ldots,n) x_i $
(che mi pare non sia altro che la media aritmetica.)
Associato a ciò ho trovato ad aesempio la varianza cosi espressa:
$ sigma^2=1/n*sum_(i =1, \ldots,n) (x_i-bar(x) _i)^2 $
e similmente per la deviazione standard
Mi chiedo allora cosa cambia tra le varie forme?
Se si parla di valor medio a quale delle due si fa riferimento di solito? a entrambe(dipende dalla situazione)?
Inoltre se considero la seconda definizione di valor medio , $ bar(x) $ , posso dire affermare che il "valor medio" coincide con la media a stessa di quel campione di dati? Quindi parlare di media o di valor medio è indiferente?
Mi scuso in anticipo se per alcuni possono essere concetti banali ma io non ho frequentato nessun corso di statistica o affine e perciò sono un po' tutti concetti estranei.
Se qualcuno può darmi una mano chiarendomi le idee su questi concetti e spiegandomi la differenza se c'è tra le due interpretazioni...grazie!!
Risposte
cia Sergio,innanzitutto grazie per la risposta!
tu mi hai detto che nel primo caso il VALOR MEDIO, $ =sum_(i = 1,\ldots,n) x_ip_i $ , altro non è che una media ARITMETICA ponderata,dove i "pesi" corrispondono alle probabilità che quel certo valore(dato) esca fuori in seguito all'esperimento.
Ora io so che la media aritmetica è però:
$ bar(x)_p=sum_(i = 1,\ldots,n) (x_ip_i)/p_i=(x_1p_1+x_2p_2+...+x_np_n)/((p_1+p_2+...+p_n) $
ora se questa fosse una media aritmetica ponderata con l'unica differenza che i pesi assumono il significato di probabilità che esca quel certo valore in seguito all'esperimento non dovrebbe esserci la somma dei pesi al denominatore,cioè la somma delle probabilità?
IL motivo per cui non c'è è forse perche la probabilità è NORMALIZATA a 1 per cui $ (p_1+p_2+...+p_n)=1 $ ?
è questo il motivo?
grazie per la disponibilità e scusate se le domande possono essere banali ma sinceramente non ho mai avuto a che fare con la statistica/probabilità (giusto le permutazioni,disposizioni ho fatto in un corso di amtematica1 ma molto alla carlona)
tu mi hai detto che nel primo caso il VALOR MEDIO, $
Ora io so che la media aritmetica è però:
$ bar(x)_p=sum_(i = 1,\ldots,n) (x_ip_i)/p_i=(x_1p_1+x_2p_2+...+x_np_n)/((p_1+p_2+...+p_n) $
ora se questa fosse una media aritmetica ponderata con l'unica differenza che i pesi assumono il significato di probabilità che esca quel certo valore in seguito all'esperimento non dovrebbe esserci la somma dei pesi al denominatore,cioè la somma delle probabilità?
IL motivo per cui non c'è è forse perche la probabilità è NORMALIZATA a 1 per cui $ (p_1+p_2+...+p_n)=1 $ ?
è questo il motivo?
grazie per la disponibilità e scusate se le domande possono essere banali ma sinceramente non ho mai avuto a che fare con la statistica/probabilità (giusto le permutazioni,disposizioni ho fatto in un corso di amtematica1 ma molto alla carlona)

ok!!
provo ora a fare un RECAP FINALE per vedere se mi sono fatto un idea complessiva corretta di questi concetti:
Tutto si gioco sul concetto di media, che ha varie definizioni a seconda del tipo di media scelto.
Comunque sia la media piu famosa e usata è la MEDIA ARITMETICA semplice, cosi definita:
$ bar(x) =1/nsum_(i = 1,\ldots,n) x_i $
Esiste poi la MEDIA ARITMETICA PONDERATA che si usa quando i dati ,i valori associati a una certa variabile hanno ciascuno un peso diverso,cosi definita:
$ bar(x)_m =(sum_(i = 1,\ldots,n) (x_ip_i ) )/(sum_(i =1, \ldots,n)p_i) $
Se poi i "pesi" $ p_i $ corrispondono alla probabilità che il valore $ x_i $ salti fuori in seguito all'esperimento associato allora la precedente espressione prende il nome di VALORE ATTESO o SPERANZA o VALORE MEDIO della "grandezza" $ X $ :
$ <>=E(X)=sum_(i =1, \ldots,n) (x_ip_i) $
inoltre se l'insieme $ X $ dei valori possibili di un esperimento è contraddistinto da un carattere CONTINUO ,allora il VALORE ATTESO(MEDIO) può essere riscritto nella forma:
$ <>=E(X)=int_(a)^(b) x*f(x) dx $
dove $ f(x) $ è una funzione di distribuzione della probabilità che ad ogni elemento $ x_i in X $ associa il corrispettivo peso $ f(x_i) $ e a,b sono in genere l'estremo inferiore e quello superiore dell'insieme $ X $ .
è corretto tutto ciò?
ho visto in fine che a volte il peso $ p_i=1/(sigma_i)^2 $ ...è vero? si usa porre i pesi come la varianza?
grazie!!
provo ora a fare un RECAP FINALE per vedere se mi sono fatto un idea complessiva corretta di questi concetti:
Tutto si gioco sul concetto di media, che ha varie definizioni a seconda del tipo di media scelto.
Comunque sia la media piu famosa e usata è la MEDIA ARITMETICA semplice, cosi definita:
$ bar(x) =1/nsum_(i = 1,\ldots,n) x_i $
Esiste poi la MEDIA ARITMETICA PONDERATA che si usa quando i dati ,i valori associati a una certa variabile hanno ciascuno un peso diverso,cosi definita:
$ bar(x)_m =(sum_(i = 1,\ldots,n) (x_ip_i ) )/(sum_(i =1, \ldots,n)p_i) $
Se poi i "pesi" $ p_i $ corrispondono alla probabilità che il valore $ x_i $ salti fuori in seguito all'esperimento associato allora la precedente espressione prende il nome di VALORE ATTESO o SPERANZA o VALORE MEDIO della "grandezza" $ X $ :
$ <
inoltre se l'insieme $ X $ dei valori possibili di un esperimento è contraddistinto da un carattere CONTINUO ,allora il VALORE ATTESO(MEDIO) può essere riscritto nella forma:
$ <
dove $ f(x) $ è una funzione di distribuzione della probabilità che ad ogni elemento $ x_i in X $ associa il corrispettivo peso $ f(x_i) $ e a,b sono in genere l'estremo inferiore e quello superiore dell'insieme $ X $ .
è corretto tutto ciò?
ho visto in fine che a volte il peso $ p_i=1/(sigma_i)^2 $ ...è vero? si usa porre i pesi come la varianza?
grazie!!

sI beh,forse ho sbagliato ad usare il lessico visto che sarebbe veramente impossibile studiare in pochi giorni tutti i concetti della statistica/probabilità in modo rigoroso e corretto.
Ciò che serve a me come dici tu è giusto un'idea generale su come procedere quando sento parlare in fisica (e soprattutto per quanto mi riguarda in chimica fisica riguardo alla chimica quantistica)di quest grandezze e del loro significato.
Sul mio libro infine in appendice trovo una rapida definizione di Varianza ,che mi viene definita in questo modo:
$ sigma_x^2=<<(x- <>)^2>>=sum_(i=1)^n(x_i- <>)^2 p_i $
mentre in giro su internet leggo spesso la definizione: $ sigma_x^2= E[(X-E[X])^2] = E[X^2]-E[X]^2 $
Queste due espressioni sono la stessa cosa vero? solo che sono scritte con simboli diversi?
Mi pare se non sbaglio che la variabile CASUALE $ X $ coincida con l'insieme di tutti i possibili valori che la variabile stessa può assumere in seguito al concretizzarsi della misurazione/esperimento.
Mentre il termine $ E(X) $ mi pare altro non sia che il valor medio probabilistico.
Quindi per calcolare la varianza dovrei sfruttare l'espressione $ sigma_x^2= E[(X-E[X])^2] $ che da quello che ho capito coincide nel calcolare per ogni elemento $ x_i in X $ l'espressione $ x_i- <> $ (che mi pare sia lo scarto)ed elevarlo poi al QUADRATO (ottenendo così lo scarto quadratico dell'elemento $ x_i $ )....una volta che ho trovato tutti gli scarti quadratici $ s_i $ associati ai corrispettivi elementi $ x_i $ devo calcolare la media ponderata probabilistica di questi scarti quadratici che ottengo in questo modo:
$ E[(X-E[X])^2]= sum_(i=1)^n (x_i-E[x])^2*p_i $
che corrisponde alla varianza.
é corretto come modo di ragionare?
graziieee
Ciò che serve a me come dici tu è giusto un'idea generale su come procedere quando sento parlare in fisica (e soprattutto per quanto mi riguarda in chimica fisica riguardo alla chimica quantistica)di quest grandezze e del loro significato.
Sul mio libro infine in appendice trovo una rapida definizione di Varianza ,che mi viene definita in questo modo:
$ sigma_x^2=<<(x- <
mentre in giro su internet leggo spesso la definizione: $ sigma_x^2= E[(X-E[X])^2] = E[X^2]-E[X]^2 $
Queste due espressioni sono la stessa cosa vero? solo che sono scritte con simboli diversi?
Mi pare se non sbaglio che la variabile CASUALE $ X $ coincida con l'insieme di tutti i possibili valori che la variabile stessa può assumere in seguito al concretizzarsi della misurazione/esperimento.
Mentre il termine $ E(X) $ mi pare altro non sia che il valor medio probabilistico.
Quindi per calcolare la varianza dovrei sfruttare l'espressione $ sigma_x^2= E[(X-E[X])^2] $ che da quello che ho capito coincide nel calcolare per ogni elemento $ x_i in X $ l'espressione $ x_i- <
$ E[(X-E[X])^2]= sum_(i=1)^n (x_i-E[x])^2*p_i $
che corrisponde alla varianza.
é corretto come modo di ragionare?
graziieee

ho capito il tuo discorso.
Sempre in termini abbastanza semplici è quindi più opportuno pensare a una variabile aleatoria come a una funzione(applicazione) $ X $ che associa ad ogni elemento $ w_i $ dello spazio campionario $ Omega $ un numero reale ,ovvero una quantità $ x_i in R $
Dove i singoli elementi $ w_i $ altro non sono che tutti i possibili risultati dell'esperimento.
Da quello che mi hai detto e ho capito non sempre i risultati di un esperimento sono di per sè dei NUMERI e quindi l'introduzione di questa applicazione $ X $ permette di associare a ciascuno di questi possibili risultati un NUMERO.
è poi possibile fare un ulteriore passo in avanti ed evidenziare il carattere probabilistico dell'esperimento individuando una funzione "Distribuzione di probabilità" $ P:(X=x_i)->p_i $ cioè che ad ogni valore numerico $ x_i $ associato a ciascun possibile esito (attraverso la funzione Variabile Aleatoria) mi associa la corrispettiva probabilità che esso accada $ p_i $
Detto tutto ciò mi chiedo come è necessario comportarsi se il risultato dell'esperimento costituisce già di numeri $ w_iin Omega sube R $
Ad esempio io dovrai trasportare tutto ciò in fisica in particolare in termodinamica e soprattutto in chimica quantistica...
In questi casi i valori possibili che può assumere una grandezza fisica sono già dei numeri...è necessario introdurre allora la funzione variabile aleatoria che mi trasformi questi numeri in altri?
non credo abbia molto senso ma vorrei sapere , grazie ancora !
Sempre in termini abbastanza semplici è quindi più opportuno pensare a una variabile aleatoria come a una funzione(applicazione) $ X $ che associa ad ogni elemento $ w_i $ dello spazio campionario $ Omega $ un numero reale ,ovvero una quantità $ x_i in R $
Dove i singoli elementi $ w_i $ altro non sono che tutti i possibili risultati dell'esperimento.
Da quello che mi hai detto e ho capito non sempre i risultati di un esperimento sono di per sè dei NUMERI e quindi l'introduzione di questa applicazione $ X $ permette di associare a ciascuno di questi possibili risultati un NUMERO.
è poi possibile fare un ulteriore passo in avanti ed evidenziare il carattere probabilistico dell'esperimento individuando una funzione "Distribuzione di probabilità" $ P:(X=x_i)->p_i $ cioè che ad ogni valore numerico $ x_i $ associato a ciascun possibile esito (attraverso la funzione Variabile Aleatoria) mi associa la corrispettiva probabilità che esso accada $ p_i $
Detto tutto ciò mi chiedo come è necessario comportarsi se il risultato dell'esperimento costituisce già di numeri $ w_iin Omega sube R $
Ad esempio io dovrai trasportare tutto ciò in fisica in particolare in termodinamica e soprattutto in chimica quantistica...
In questi casi i valori possibili che può assumere una grandezza fisica sono già dei numeri...è necessario introdurre allora la funzione variabile aleatoria che mi trasformi questi numeri in altri?
non credo abbia molto senso ma vorrei sapere , grazie ancora !

Sergio ,grazie per l'aiuto!!
cercherò ora di approfondire un po' l'argomento tenendo conto delle dritte che mi hai dato!
cercherò ora di approfondire un po' l'argomento tenendo conto delle dritte che mi hai dato!