Dubbi sulla varianza massima

Nebula2
ho trovato delle maggiorazioni della varianza che mi hanno creato dei problemi.

1. fissata la media, si ha varianza massima quando n-1 dati sono nulli.
2. $V \leq ( \frac{x_{max} - x_{min}}{2})^2$.
3. $V \leq ( \frac{x_{max} - x_{min}}{3})^2$ se la distribuzione è unimodale.


per quanto riguarda la prima, intuitivamente la capisco ma formalmente non sono riuscito ad ottenerla. ho provato usando i moltiplicatori di lagrange, ma niente.
la seconda se non sbaglio penso che dica che la varianza è minore uguale a quella che avrei con 2 soli dati, il più grande e il più piccolo. anche qui mi torna, ma come la si può ricavare?
la terza... mi sfugge.

suggerimenti?

Risposte
Lo_zio_Tom
comincio dal primo: non mi pare affatto vero, in generale.

La varianza si può definire così:

$V(X)= (sum_(i=1)^n X_(i)^2)/n-(bar(X))^2$

ora, fissato $bar(X)$ , se $(n-1)$ valori sono nulli significa che l'unico valore non nullo è pari a $sum_(i=1)^n X_i$

e di conseguenza, sfruttando la definizione di varianza che ti ho indicato, secondo la proposizione del testo dovremmo avere

$(sum_(i=1)^n X_i)^2>=sum_(i=1)^n X_(i)^2$

che evidentemente è vera se tutti i valori $X_i$ hanno lo stesso segno, e ciò per la presenza dei doppi prodotti (tutti positivi) nello sviluppo del quadrato del primo membro....ma può non essere vera se i valori $X_i$ hanno segni alterni

sei d'accordo?

Nebula2
non sono sicuro di aver capito il tuo argomento, però se ho capito bene penso che il problema sia nell'aver fatto uso di un solo insieme di dati.
formalmente, quello che ho letto dovrebbe essere, avendo indicato con $\mu$ la media:
$ \forall \mu in \RR,$
$ \forall X in \RR^n | 1/n \sum_i X_i = \mu,$
$ \forall Y \in \RR^n | Y_1=n\mu, \quad Y_i=0 \quad \forall i>1,$
$ V(X) \leq V(Y).$

è equivalente a quello che scrivevi tu?

Lo_zio_Tom
sì è quello che intendevo. In generale dovrebbe essere

$mu=sum_(i=1)^n x_i p(x_i)$ ma dato che il testo nulla dice circa la distribuzione ho scelto quella che mi pare, ovvero una uniforme con media $mu=1/n sum_(i=1)^(n)X_i$

Altra cosa che il testo non dice (ma che ho solo ipotizzato) è che il supporto della variabile X sia composto da n valori: il testo dice solo che ci sono $(n-1)$ valori nulli senza aggiungere altro....

Ora, dato che il testo dice "media fissata" si intende che la media delle due variabili è uguale e quindi per confrontare le varianze, avendo scelto una variabile con i pesi tutti uguali, basta confrontare la somma dei quadrati dei valori del supporto ottenendo

$V(Y)>=V(X) rarr sum_(i)y_(i)^2>=sum_(i)x_(i)^2 rarr (sum_i x_i)^2>=sum_(i)x_(i)^2$

E' evidente che, se il supporto della X è non negativo (non positivo) allora tale disuguaglianza è vera, altrimenti non si può dire nulla e quindi la 1. è falsa.

Nebula2
una precisazione: ho dato io per scontato il numero dei dati.
questi sono n, e la distribuzione con varianza (supposta) massima è quella in cui n-1 sono nulle e una sola diversa da zero.
per quanto riguarda la distribuzione, porla costante non fa perdere di generalità penso.

comunque sì, mi torna quello che scrivi.
sto leggendo un libro di statistica ("statistica per le decisioni" di d. piccolo, ed. il mulino, 2004), quindi forse, anche alla luce degli esempi che presenta, assume che i valori dei dati siano tutti non negativi. anche se mi sfugge dove lo esprime esplicitamente.
in quel caso il tuo argomento dovrebbe fare da dimostrazione.

Altrimenti, in effetti è semplice trovare dati discordi del tipo $X={-1,5}$ per avere un controesempio.

Già che ci siamo... hai anche qualche idea per le altre 2?

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.