Confronto disuguaglianza di Chebyshev e distribuzione Normale
Ciao a tutti.
Riporto qui il testo di un semplice esercizio che sul mio libro viene risolto mediante la disuguaglianza di Chebyshev.
Il numero di pezzi prodotti da una fabbrica in una settimana è una variabile aleatoria di media 50. Se si suppone nota la varianza pari a 25, cosa si può dire sulla probabilità che la produzione sia compresa tra i 40 e i 60 pezzi?
Risoluzione:
$P( 40 <= X <= 60 ) = P( |X-50| <= 10 ) >= 1- 25/10^2 = 0,75 $
La mia domanda è: se io risolvessi l'esercizio mediante una distribuzione normale è corretto? E qual è la differenza tra i due metodi?
Io ho provato a svolgerlo nel seguente modo mediante la distribuzione normale:
$ P(40 <= X <= 60 ) = P( (40-50)/5 <=Z<=(60-50)/5 ) = P(-2<=Z<=2) = phi(2) - phi(-2) =$
$=phi(2) - (1-phi(2)) = 0,9772 - (1-0,9772) = 0,9544 $
Riporto qui il testo di un semplice esercizio che sul mio libro viene risolto mediante la disuguaglianza di Chebyshev.
Il numero di pezzi prodotti da una fabbrica in una settimana è una variabile aleatoria di media 50. Se si suppone nota la varianza pari a 25, cosa si può dire sulla probabilità che la produzione sia compresa tra i 40 e i 60 pezzi?
Risoluzione:
$P( 40 <= X <= 60 ) = P( |X-50| <= 10 ) >= 1- 25/10^2 = 0,75 $
La mia domanda è: se io risolvessi l'esercizio mediante una distribuzione normale è corretto? E qual è la differenza tra i due metodi?
Io ho provato a svolgerlo nel seguente modo mediante la distribuzione normale:
$ P(40 <= X <= 60 ) = P( (40-50)/5 <=Z<=(60-50)/5 ) = P(-2<=Z<=2) = phi(2) - phi(-2) =$
$=phi(2) - (1-phi(2)) = 0,9772 - (1-0,9772) = 0,9544 $
Risposte
intanto benvenuto nel forum!
noto con piacere che hai scritto un post con tutti i "crismi", ovvero con bozza di soluzione e formule scritte bene!
la principale differenza l'hai già trovata....che passi da una confidenza del 75 % al 95%.
Ciò in quanto la disuguaglianza di Cebicev è valida qualunque sia la distribzione (continua) della variabile $X$.
La domanda è un'altra...puoi appicare (ovvero approssimare) la distribuzione con una Gaussiana?
Occorre avere un campione (qui hai solo un'osservazione) abbastanza grande tale da poter applicare il teorema del limite centrale
ciao
noto con piacere che hai scritto un post con tutti i "crismi", ovvero con bozza di soluzione e formule scritte bene!
la principale differenza l'hai già trovata....che passi da una confidenza del 75 % al 95%.
Ciò in quanto la disuguaglianza di Cebicev è valida qualunque sia la distribzione (continua) della variabile $X$.
La domanda è un'altra...puoi appicare (ovvero approssimare) la distribuzione con una Gaussiana?
Occorre avere un campione (qui hai solo un'osservazione) abbastanza grande tale da poter applicare il teorema del limite centrale
ciao
eccoti un esempio che ti chiarirà la questione.

(per legge debole dei grandi numeri si intende proprio la disuguaglianza di Cebicev)
Qui sì che si deve applicare la gaussiana (teorema del limite centrale) perché il vantaggio di avere un intervallo più ristretto è supportato dalla giusta applicazione del teorema in questione...nel tuo esercizio, purtroppo, non avendo verificato ipotesi circa la Normodistribuzione della produzione, e non avendo dati a disposizione, non puoi applicare la Gaussiana....
ciao

(per legge debole dei grandi numeri si intende proprio la disuguaglianza di Cebicev)
Qui sì che si deve applicare la gaussiana (teorema del limite centrale) perché il vantaggio di avere un intervallo più ristretto è supportato dalla giusta applicazione del teorema in questione...nel tuo esercizio, purtroppo, non avendo verificato ipotesi circa la Normodistribuzione della produzione, e non avendo dati a disposizione, non puoi applicare la Gaussiana....
ciao
Grazie della tua risposta tommik.
Quindi possiamo dire praticamente che la disuguaglianza di Chebyshev è una considerazione più generica di quella della distribuzione normale. Cioè intendo dire che la disuguaglianza di Chebyshev ci dice che la probabilità sarà sicuramente maggiore del 75% mentre la distribuzione normale ci da un'informazione più precisa sul fatto che il valore che può assumere la variabile aleatoria X sia all'interno dell'intervallo [40;60]. Giusto?
Pongo questa domanda perchè ho provato ad applicare lo stesso ragionamento su altri esercizi e il calcolo della probabilità mediante la disuguaglianza di Chebyshev, a parer mio, non risulta fattibile.
ESEMPIO
Sia X la variabile aleatoria che descrive la temperatura in °C che si può registrare alle 12 di un giorno di dicembre qualunque in Piazza Duomo. Si suppone che X sia distribuita come una normale di media = 6 e varianza = 4. Qual è la probabilità che il giorno di Natale la temperatura sia compresa tra 7°C e 8°C?
Svolgimento:
Distrib. Normale
$ P=(7<=X<=8)=P(1/2<=Z<=1)= phi(1)-phi(1/2)=0,1498 $
Disuguaglianza Chebyshev
$ P(7<=X<=8)=P(|X-6|<=1)>=1-4/1=-3 ??? $
Quindi possiamo dire praticamente che la disuguaglianza di Chebyshev è una considerazione più generica di quella della distribuzione normale. Cioè intendo dire che la disuguaglianza di Chebyshev ci dice che la probabilità sarà sicuramente maggiore del 75% mentre la distribuzione normale ci da un'informazione più precisa sul fatto che il valore che può assumere la variabile aleatoria X sia all'interno dell'intervallo [40;60]. Giusto?
Pongo questa domanda perchè ho provato ad applicare lo stesso ragionamento su altri esercizi e il calcolo della probabilità mediante la disuguaglianza di Chebyshev, a parer mio, non risulta fattibile.
ESEMPIO
Sia X la variabile aleatoria che descrive la temperatura in °C che si può registrare alle 12 di un giorno di dicembre qualunque in Piazza Duomo. Si suppone che X sia distribuita come una normale di media = 6 e varianza = 4. Qual è la probabilità che il giorno di Natale la temperatura sia compresa tra 7°C e 8°C?
Svolgimento:
Distrib. Normale
$ P=(7<=X<=8)=P(1/2<=Z<=1)= phi(1)-phi(1/2)=0,1498 $
Disuguaglianza Chebyshev
$ P(7<=X<=8)=P(|X-6|<=1)>=1-4/1=-3 ??? $
qui hai proprio sbagliato ad applicarla
$P(|X-mu|=1-sigma^2/epsilon^2$
per applicarla (qui non serve, dato che hai la distribuzione) devi comunque trovare un intervallo simmetrico alla media. Nell'esercizio ti dice che la media è 6 e vuole la probabilità che la variabile sia tra 7 e 8.......
Fai l'esercizio che ti ho indicato.....
Riassumendo: Usi la disuguaglianza di Cebicev quando la distribuzione non è specificata. Quando la distribuzione è nota usi quella perché ti dà un intervallo ottimale. Inoltre.....anche quando la distribuzione non è nota, non appena $n$ è sufficientemente grande, usi sempre la Gaussiana.
$P(|X-mu|
per applicarla (qui non serve, dato che hai la distribuzione) devi comunque trovare un intervallo simmetrico alla media. Nell'esercizio ti dice che la media è 6 e vuole la probabilità che la variabile sia tra 7 e 8.......
Fai l'esercizio che ti ho indicato.....
Riassumendo: Usi la disuguaglianza di Cebicev quando la distribuzione non è specificata. Quando la distribuzione è nota usi quella perché ti dà un intervallo ottimale. Inoltre.....anche quando la distribuzione non è nota, non appena $n$ è sufficientemente grande, usi sempre la Gaussiana.

Comunque ti ringrazio del riassunto concettuale era quello che cercavo per capire la differenza tra i due metodi.
