Stima numero taxi

cenzo1
Un po' stanchi -ma soddisfatti- della vacanza, andammo alla fermata dell'autobus per raggiungere l'aeroporto.
Durante l'attesa Pasquale ha osservato il transito di cinque taxi, contraddistinti dai seguenti numeri: 4, 75, 25, 5, 15.

Occorre stimare il numero di taxi circolanti in città.

Risposte
Summerwind78
- Attendi il passaggio di un altro taxi
- leggi il numero di telefono della compagnia a cui appartengono sul lato del taxi
- telefoni e chiedi quanti taxi hanno in totale

Risultato: stima molto accurata


:P

Mrhaha
"Summerwind78":
- Attendi il passaggio di un altro taxi
- leggi il numero di telefono della compagnia a cui appartengono sul lato del taxi
- telefoni e chiedi quanti taxi hanno in totale

Risultato: stima molto accurata


:P


:-D
Mmmm... cenzo quando dici "circolanti" intendi attivi sempre? Cioè supponiamo che tutti i taxi siano in circolazione e che tutti sono di turno?

Summerwind78
io suggerirei di non alimentare la cretinata scherzosa da me scritta.


:-D

Mrhaha
Almeno 75 circolano sicuro!

Giant_Rick
"Mrhaha":
Almeno 75 circolano sicuro!


Magari in città sono scaramantici e non c'è il taxi n°17.
Ne circolerebbero 74! :-D

cenzo1
Mi fa piacere constatare il clima scherzoso :)

"Summerwind78":
- Attendi il passaggio di un altro taxi
- leggi il numero di telefono della compagnia a cui appartengono sul lato del taxi
- telefoni e chiedi quanti taxi hanno in totaleP

Putroppo non è possibile. E' già stato molto faticoso procurarsi quei cinque dati...

"Mrhaha":
"circolanti" intendi attivi sempre? Cioè supponiamo che tutti i taxi siano in circolazione e che tutti sono di turno?

Intendo quanti taxi ci sono complessivamente nella flotta.

"Mrhaha":
Almeno 75 circolano sicuro!

Mi sembra ragionevole. Però è troppo generico. Ci occorre almeno una stima puntuale.

"Giant_Rick":
Magari in città sono scaramantici e non c'è il taxi n°17.
Ne circolerebbero 74! :-D

Non è un paese italiano (ad esempio nei paesi anglosassoni è il 13 a portare male).
A parte gli scherzi, non abbiamo indizi per ritenere che manchi qualche numero.

Rggb1
E' un po tardino, comunque calcolando al volo:


Ps. Interessante come problemino.

Fioravante Patrone1
Ci sono n taxi.
La probabilità che uno passi è uniforme (1/n).
Dato questo, posso stimare la prob di estrarre i numeri 4, 75, 25, 5, 15.
Estrazioni indipendenti? Ovvio che non lo sono, ma forse lo possiamo assumere senza troppe distorsioni (per risparmiarci dei conti).
La risposta sta qui: mi chiedo per quale n la prob di osservare la cinquina estratta sia più alta.
Robe bayesiane, quindi. Però a naso direi che n è proprio 75.

Visto che sono una capra in p&s (e infatti nessun relatore mi ha mai dato una tesi su queste materie), il mio ragionamento farà acqua da tutte le parti, immagino.

Summerwind78
Anche io sono tremendo in probabilità e statistica, ma a ragionamento non è possibile stimarlo.

Dobbiamo sempre tener conto se:

possiamo mettere la testa nella lava e i piedi nel ghiaccio e e dire che stiamo "mediamente bene" o che siamo morti con i piedi al freddo?

Pertanto:
Non sappiamo la dimensione della città quindi il numero di taxi che coprono l'intera rete urbana potrebbe essere elevato e noi abbiamo visto solo 5 taxi.

l'unica informazione veramente deducibile è che la flotta contenga almeno 75 taxi, ammesso che non ci siano numeri mancanti. Tutto il resto è indeducibile.

Rggb1
Non si chiede di dedurre alcunché, ma di fare una stima puntuale del numero di taxi.

Ho rifatto i calcoli, confermo il mio risultato di prima: se questo coincide con quello di cenzo, fornirò spiegazione; viceversa (in caso di figura di censored), mi asterrò dall'esporre elucubrazioni campate in aria. ;)

cenzo1
"Fioravante Patrone":
il mio ragionamento farà acqua da tutte le parti, immagino.

No, anzi. Hai tirato fuori lo stimatore di massima verosimiglianza, un buon candidato.
Se $N$ è la dimensione della flotta e $n$ la dimensione del campione osservato, la prob di osservare quella cinquina dovrebbe essere (estrazioni senza ripetizione):

$1/N*1/(N-1)*...*1/(N-n+1)$,

massima per N minimo, da cui risulta una stima $\hat N=x_{(n)}$ (quindi 75 per il nostro campione)
dove con $x_{(i)}$ indico i dati del campione ordinati.
Un difetto di questo stimatore è che tende sistematicamente a sottostimare $N$, quindi è affetto da un bias (distorsione).

PS: mi si perdoni la battuta: una prostituta come correlatore? che figata! :P
A parte le battute, hai citato delle problematiche molto interessanti.

"Rggb":
Ho rifatto i calcoli, confermo il mio risultato di prima: se questo coincide con quello di cenzo, fornirò spiegazione

Non conosco il valore "vero" che vogliamo stimare :)
Ho alcuni stimatori, costruiti con diversi criteri, i quali forniscono diverse stime.
Uno di questi è lo stimatore di massima verosimiglianza, proposto da Fioravante.
E' interessante indagare quale sia (se esiste) quello migliore.
Perciò, anche se il tuo valore mi torna un po' alto, è interessante vedere come lo hai costruito :wink:

Fioravante Patrone1
\OT
"cenzo":
PS: mi si perdoni la battuta: una prostituta come correlatore? che figata! :P
Pensa alla seduta di laurea, chissà quanti clienti avrà in commissione :twisted:
\TO

Rggb1
"cenzo":
Perciò, anche se il tuo valore mi torna un po' alto, è interessante vedere come lo hai costruito :wink:

Ehm :oops: l'ho costruito male (usando la varianza), poiché facendo i calcoli ammodino e verificandoli due volte, ora mi accorgo che verrebbe una popolazione inferiore alle 70 unità. :?:

Evidentemente sono lontano, ci penserò.

cenzo1
"Rggb":
l'ho costruito male (usando la varianza)

E' interessante l'idea di sfruttare la varianza.
Quindi hai uguagliato la varianza del modello uniforme a quella campionaria ? (*)

Non c'è da meravigliarsi che possa uscire un valore anche inferiore al massimo (75).
Uno stimatore che avevo considerato l'ho ricavato uguagliando la media della uniforme a quella campionaria:

$(1+N)/2=\bar x \to \hat N=2 \bar x -1$

E' facile mostrare che questo stimatore è corretto ($E[\hat N]=N$), però può fornire stime inferiori a $x_{(n)}$.
Ad esempio sul campione osservato risulterebbe una stima di $48.6 \sim 49$.

(*)
Sto provando ad usare il criterio della varianza.
Se impongo la varianza della uniforme uguale alla varianza campionaria corretta mi torna una stima di circa 102.
Se invece uso la varianza campionaria non corretta mi torna circa 91 (salvo errori).
Non ho capito come hai ottenuto il 70.

Mrhaha
Ragazzi ma questa sarebbe inferenza bayesiana?

DajeForte
Ma io pensavo che avessi la soluzione, cenzo.

Vedi se questi ti tornano utili:
http://en.wikipedia.org/wiki/Uniform_di ... _(discrete)
http://en.wikipedia.org/wiki/German_tank_problem

@Rggb: Ma dopo Gene Hackman chi ci proporrai? P.S. Mi sa che tra poco mi servirà il tuo aiuto con c++.

cenzo1
"DajeForte":
http://en.wikipedia.org/wiki/German_tank_problem

Mi hai bruciato la domanda.. :-D

Si, avevo la soluzione, ma era interessante avere una panoramica dei vari stimatori che si potevano tirare fuori con diversi criteri. Dopo averne tirati fuori un bel po', pensavo di proporre dei boxplot e di confrontare l'MSE.. quindi arrivare alla soluzione un po' alla volta.. :D

Vabbè.. allora ne approfitto: non ho compreso il ragionamento (sul link wiki) che porta a costruire l'intervallo di confidenza
$[m/q^{1/k}, m/p^{1/k}]$.
Suggerimenti ?

DajeForte
Se $X$ è Uniforme (0,N)

$P(max(X_1,...X_k)<=x)=(P(X<=x))^k=(x/N)^k$ ed imponi questa prob uguale a p (o q).

PS scusa non avevo capito le tue intenzioni.

cenzo1
@ Daje: Ok, grazie :)

Rggb1
"cenzo":
Se impongo la varianza della uniforme uguale alla varianza campionaria corretta mi torna una stima di circa 102.
Se invece uso la varianza campionaria non corretta mi torna circa 91 (salvo errori).

Ma allora sono un popone!

Ho fatto il calcolo a mente, e mi veniva "100 o giù di lì". L'ho fatto con foglio elettronico, idem (però ricordo veniva 100, non 102). Ho ricontrollato e mi veniva 60... mah! :roll:

Credo il tuo calcolo sia corretto, dopo lo rifarò per l'ennesima volta :-D. Ma decisamente, è arrivato il momento definitivo di buttare via i fogli di calcolo e compagnia cantante.

EDIT: mi accorgo dal messaggio precedente che sembrava avessi ottenuto 70, non è così: mi veniva 60, ed ovviamante intendevo dire "inferiore a 75" cioè al valore massimo osservato.

"DajeForte":
Ma dopo Gene Hackman chi ci proporrai?

Nuovo avatar in arrivo! :-D

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.