Esercizio approssimazione della binomiale alla normale

Sk_Anonymous
Ho svolto questo esercizio approssimando la binomiale alla distribuzione normale. Il risultato che ottengo è 0,74857. I dati sono:
valore atteso:
$E(X)=np=300*0,2073=62,19$.
e varianza
$Var(X)=np(1-p)=62,19*0,7927=49,2980$
$0,7927=1-0,2073$
possiamo procedere all'operazione di standardizzazione. Quindi $P(X>57+0,5)$:
$z=(57,5-62,19/$$sqrt(49,298))$$=$$$$-4,69$$/frac {7,0213}$$=-0,6680$$$$
La $P(Z>--0,6680) è 0,74857$.
Questo risultato non conicide con quello dato. Cosa ho sbagliato?
Per una specie equina, la percentuale di cavalli di colore nero è pari al 20,73%. Quale è la probabilità che in un campione casuale di 300 cavalli, oltre 57 siano neri?
Risultato: 0,77

Risposte
adaBTTLS1
questa volta invece viene il risultato del libro se usi 57 e non 57.5 ...
considerando che la media non è intera, e che chiede la probabilità che il numero sia "maggiore" di 57, mentre nella tavola puoi vedere solo la probabilità che il numero sia "minore" di ... , se consideri $57$, è come controllare $<=67.38$, se consideri $57.5$, è come controllare $<=66.88$.
magari sto parlando "a vanvera", e non c'entra nulla. è lo stesso testo che riporta i due risultati (questo e quello dell'altro topic)?

Sk_Anonymous
Ada non ho capito bene, hai un libro con lo stesso esercizio? Ho fatto la prova senza 0,5 e viene il risultato esatto. Qual è l'altro topic?

Aliseo1
A me invece esce

$ \mu=np=300*0.2073=62.19 $, $ \sigma=\sqrt(62.19*0.7927)=7.021254375 $ e $a=57-0.5=56.5$. Allora

$ z=(56.5-62.19)/(\sigma)=-0.810396504 $. Quindi $ P(X >= 57)=P(Z>=-0.810396504)=0.5+0.2910=0.7910 $. Strano che esca $0.77$

Sk_Anonymous
ALISEO, GUARDA IL TERZO POST "DISTRIBUZIONE NORMALE". PER FAVORE, GRAZIE

adaBTTLS1
avevo pensato anch'io di utilizzare 56.5, ma non corrisponde alla traccia: parla di oltre 57 e non di $>=57$

@ polt
mi riferivo al fatto che quella sorta di interpolazione con i numeri interi se un testo la fa dovrebbe risultare in tutti gli esercizi simili, ma non credo che tutti i testi la facciano. perciò, per confronto dei due esercizi, uno viene con una variazione di 0.5 e uno viene se non si applica la variazione, può essere normale se sono presi da due testi diversi, ed invece è strano se sono dello stesso testo ...

Sk_Anonymous
Ma il testo al quale ti riferisce, qual è? Grazie

adaBTTLS1

Sk_Anonymous
Dopo un pò di ragionamento sono giunto a queste con conclusioni: l'applicazione della correzione di continuità (0,5000) dipende dal carattere che si sta osservando, cioè se si tratta di caratteri discreti o continui. Di conseguenza in alcuni casi è necessaria in altri no. Con riferimento all'esercizio non si applica la correzione, il perché non l'ho ancora capito, magari è evidente ma me ne rendo conto, comunque ci sono i risultati che ci aiutano in questo, in quanto se la soluzione che otteniamo è fra di essi, l'esercizio è stato svolto correttamente. Viceversa, se il risultato non è fra quelli proposti dall'esercizio, allora bisogna applicare in aumento o in diminuzione la correzione di continuità. Mi rendo conto che si tratta di un ragionamento più meccanico che consapevole, ma sono sempre graditissime le ulteriori spiegazioni, magari di gente più esperta.

Sk_Anonymous
Grazie mille, maestro. Qaundo puoi guarda anche questo topic: "esercizio calcolo probabliità distribuzione binomiale". Terzultimo topic prima pagina.

adaBTTLS1
@ Sergio:

per il punto b) che non ti convince, non intendevo 57, ma 57.5, come ha fatto polt.
siccome però i confronti sono con valori non interi perché la media non è intera, è probabile che il libro abbia considerato solo 57. ma non che lo creda giusto. soprattutto non è coerente con l'altro esercizio citato.
mi associo alla domanda, che peraltro era stata anticipata in altra forma: da dove vengono gli esercizi? vengono dallo stesso testo?

Sk_Anonymous
Sono esercizi assegnati dal prof. Ma non dettati, tramite pdf. A me capita talvolta in questi esercizi, che il risultato non sia identico, ma vicino. Come quello dell'esercizio del topic "calcolo probabliità distribuzione binomiale". Sergio ed Ada, potrebbe essere un problema di arrotondamenti dei calcoli, che ha fatto il prof, e che io arrotondo in maniera diversa? Un'altra cosa, perché questo, quando succede, succede solo ed esclusivamente per gli esercizi sulle probabilità?

olaxgabry
A mio parere entrambi i modi sono corretti. In particolare l'utilizzo del fattore correttivo $0.5$ migliora l'approssimazione, ma non utilizzarlo non è proprio un errore. Io a suo tempo mi "scervellai" e non poco perché alcuni testi la usavano mentre altri no e non sapevo dove andare a "parare".
Lessi inoltre che per "k" numero di successi non elevato e "p" piccolo è consigliabile approssimare la binomiale con la "Poisson".
Ciao a tutti, in particolare a Sergio che su $R$ mi ha risolto non pochi problemini (anche se ultimamente ho notato che spesso l'esecuzione dei codici è lenta :smt017 )

Sk_Anonymous
Non mi riferivo alle approssimazioni, ma agli arrotondamenti di calcolo o a risoluzioni fatte tramite eleboratore, utilizzati dal professore, che potrebbero condurre a risultati diversi rispetto ai miei.

Aliseo1
riguardo al programma R, si è un po' lento nella risoluzione degli esercizi! Dipende comunque dalla mole dei dati e dalla versione! Anch'io mi trovo molto bene con R, anche se nel mondo del lavoro non è tanto utilizzato, lo si utilizza maggiormente a livello di didattica.

Riguardo al passaggio dal discreto al continuo, io ho sempre operato (anche perché mi è stato sempre insegnato) come ho fatto inizialmente: aggiungendo e sottraendo $0.5$. Per esempio, in riferimento proprio all'esercizio di questo post si richiede la probabilità $P(X>57)$ no? Ma questo è come scrivere $ P(X>57)=1-P(X<=57) $ e, dunque, (precedentemente avevo commesso un errore) passando dal discreto al continuo, e come ho scritto inizialmente, $b=57+0.5=57.5$. Allora

$ P(X>57)=1-P(X<=57)=1-\int_{-\infty}^{57.5} f(x|N(62.16;43.30))dx=1-\int_{-\infty}^{-0.66}f(z|N(0,1))dx=1-[0.5-0.2454]= 0.7454$.

Infine, se si calcola proprio il valore vero della probabilità $ P(X>57)=1-P(X<=57) = 1- \sum_{x=0}^{57}((300), (x))*(0.2073)^x*(0.7927)^(300-x)=0.7454220536 $

Come si è detto all'inizio o è un problema di arrotodamenti (una volta si considerano 3 cifre decimali, altre volte 2 ecosì via) o le risposte date agli studenti sono errati. Forse le risposte errate sono sbagliate volutamente, proprio per invogliare gli studenti a capire bene e a ragionar sugli esercizi (tutto può essere!) ;)

olaxgabry
"Aliseo":
riguardo al programma R, si è un po' lento nella risoluzione degli esercizi! Dipende comunque dalla mole dei dati e dalla versione! Anch'io mi trovo molto bene con R, anche se nel mondo del lavoro non è tanto utilizzato, lo si utilizza maggiormente a livello di didattica.

Più che dalla versione ho riscontrato proprio una lentezza nelle esecuzione di alcuni codici: tipo ho fatto lo schema di Eulero per le equazioni differenziali stocastiche ed alcune volte l'attesa era snervante (addirittura di ore); ho portato il tutto in java e la cosa si è risolta in pochi secondi (anche se in java ho alcuni dubbi sul comando che genera numeri pseudo normali, a riguardo ne sai qualcosa.)
Ciao e scusate l'OT.

Aliseo1
No, non utilizzo per niente Java. Però mi hai fatto incuriosire circa lo schema di Eulero per le equazioni differenziali stocastiche ... potresti indicarmi il link da cui hai preso il codice? o anche dirmi il titolo del libro ;)

olaxgabry
"Aliseo":
No, non utilizzo per niente Java. Però mi hai fatto incuriosire circa lo schema di Eulero per le equazioni differenziali stocastiche ... potresti indicarmi il link da cui hai preso il codice? o anche dirmi il titolo del libro ;)

Il codice l'ho fatto io e tratta equazioni differenziali stocastiche a coefficienti costanti: non ho alcun problema a postartelo. Un libro su cui la parte di simulazione è fatta molto bene è "Numerical solution of stochastic differential equation" di Kloeden: per la parte di teoria preferisco il Karatzas "Brownian motion and stochastic calculus".
Comunque il parole povere hai l'equazione differenziale stocastica lineare

$dX_{t}=a*X_{t}*dt + b*X_{t}dW_{t}$

dove $W_{t}$ è un moto browniano. Usando la formula di Ito con $f(x)=ln(x)$ giungi alla soluzione

$X_{t}=X_{0}*e^{(a-\frac{b^{2}}{2})*t+b*W_{t}}$

Per utilizzare Eulero prima discretizzi facendo una partizione dell'intervallo

$0=t_{0}
e supponi per comodità che l'ampiezza degli intervalli sia pari a $delta$. L'approssimazione con Eulero è

$Y_{n+1}=Y_{n}+a*Y_{n}*delta+b*Y_{n}*\Delta W_{n}$

Adesso confronto questa soluzione approssimata con quella reale, valutata nel tempo discreto. In particolare ho analizzato l'ordine di convergenza: se $b=0$ è pari a 1 mentre all'aumentare di $b$ questo si assesta a $0.5$.
Scusa se forse ho scritto cose che già sapevi, era solo per darti un'idea su come ho ragionato.
Fammi sapere se vuoi il codice.
Ciao

Sk_Anonymous
Aliseo e Oax volevo chiederv, la stessa formula della scomposizione della varianza totale, che mi hai suggerito (Aliseo) e la spiegazion teorica, è possibile trovarli sul qualche documento, su internet. Perché sul mio testo non è presente, o almeno non lo è in questi termini. Grazie.

olaxgabry
Bè non ho parole per ringraziarti, come sempre disponibilissimo ed esaustivo. Domani proverò a fare il tutto e vediamo se ne esco "vivo" (chiaramente in senso metaforico).

Sui numeri pseudocasuali in java: ho trovato che il comando che genera numeri pseudocasuali è rand.nextGaussian() e li genera nel modo classico della trasformazione di Box-Muller. Inoltre li genera da una normale media 0 e varianza 1: a me servono di media 0 e varianza h; ho pensato di moltiplicare i numeri generati per $sqrt(h)$, che ne pensi?

Grazie ancora.
Ciao

olaxgabry
Grazie Sergio, la tua conferma mi fa stare tranquillo.
Sul fatto di R ho pensato che potesse dipendere dal codice (in fondo tre cicli for non sono pochi), però con java va nettamente meglio. Ora proverò quello che mi hai consigliato perché vorrei continuare ad utilizzare R (di java non ne so tantissimo).

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.