Altro giochino

alfabeta2
qual è la probabilità che un numero intero elevato al quadrato dia come risultato un numero che ha come prima cifra 7?

Risposte
marmi1
Ritendo che l'approccio di

@blackbishop13

consista esattamente nell'approssimare $sqrt(7), sqrt(8), sqrt(70),sqrt(80) $
e di considerare equiprobabili gli interi $ in [10^n,10^(n+1))$

In sintesi, io non riesco a trovare un modo per rispondere alla domanda iniziale,
e questo dipende dal fatto che non so come si possa scegliere un intero " a caso".

ciao,
Andrea

canemacchina
Scusatemi, la cosa mi ha incuriosito ma, da ignorantone, mi sono un attimo perso nella vostra discussione.

@blackbishop13: perchè dici che "2. Non mi convincerete mai che sia più probabile che un numero inizi per 1 piuttosto che per 7. e tantomento che la probabilità vari proporzionalmente con la cifra."?

Leggendo l'articolo sulla legge di Benford, le idee intuitive mostrate per "convicere" che la legge è corretta, mi sembrano che chiariscano la cosa.
Fondamentalmente mi sembra di capire che il tutto dipende dal range di valori usato per scegliere i numeri casuali.
Allora, posto che la probabilità la calcoliamo come [tex]\dfrac{casi\; favorevoli}{casi\; totali}[/tex], calcoliamo questo numero.

Io avevo ragionato in questo modo, per cercare di capire perché sembrassero meno quelli che iniziavano con 7 rispetto agli altri:
supponiamo di calcolare la probabilità precedente considerando numeri di al massimo k cifre:

[tex]casi\;totali = n^k + n^{k-1} + \ldots + n[/tex]
[tex]casi\;favorevoli = n^{k-1} + n^{k-2} + \ldots + 1[/tex]

Per i casi totali non credi ci siano bisogno di spiegazioni, per i casi favorevoli il ragionamento è analogo, ovviamente considerando che i numeri contati sono generati così:
1) fisso la prima cifra (più significativa) a 7 e le altre k-1 le posso scegliere ognuna tra gli n valori;
2) ai precedenti sommo i numeri per i quali fisso le prime due cifre (la prima a 0 e la seconda a 7 e poi le restanti k-2 cifre posso sceglierle ognuna tra gli n valori
3) ecc ecc fino ai numeri a 1 cifra che sono esattamente uno (il 7, appunto)

Il calcolo è quindi: [tex]\dfrac{n^{k-1} + n^{k-2} + \ldots + 1}{n^k + n^{k-1} + \ldots + n} = \dfrac{1}{n}\; \forall k\in\mathbb{R}[/tex]
E il risultato direi che è corretto, dato che scegliendo casualmente valori tra 0 e infinito, non può essere altrimenti che la probabilità che un numero inizi con 7 sia equiprobabile alla probabilità che inizi con 1, che inizi con 2, ecc ecc...

Quello che mi sembrava di capire leggendo la legge di Benford è che la cosa può non essere vera quando scegliamo casualmente un numero in un range non più infinito, ma finito.
Questo perché il modo di scegliere i numeri al fine di calcolare i casi favorevoli è condizionato dal numero massimo che limita il mio range.
Riporto dall'articolo in italiano:
Facciamo allora un esperimento teorico: scegliamo un numero a caso fino a un certo valore N. Se ad esempio ci capita di scegliere per N il numero 199, più di metà delle nostre possibili scelte inizia per 1; infatti c'è 1, i dieci numeri da 10 a 19, e i cento da 100 a 199. Certo che se avessimo scelto N=999 il risultato sarebbe stato equo; ma sicuramente la cifra 1 non apparirà mai meno delle altre.


La cosa mi sembra coerente. Se scelgo come limite un numero la cui prima cifra è minore di quella che considero, mi "perdo" tutti i numeri che iniziano con quella cifra e con lo stesso numero di cifre di quelle della cifra che pone il limite. Quindi intuitivamente mi aspetto che, fissato il limite, la probabilità sia equa per i numeri che iniziano con una cifra minore o uguale alla prima cifra del numero limite, e inferiore (ma sempre equa tra loro) per gli altri.
Ovvero, sempre con un esempio, considerando il limite a 599, mi aspetto che i numeri che iniziano con 1, 2, 3, 5 abbiano stessa probabilità tra loro, quelli che iniziano con 6,7,8,9 abbiano la stessa probabilità tra loro, ma che al probabilità che un numero inizi con 1, 2, 3, 4 o 5 sia maggiore di uno che inizi con 6, 7, 8 o 9.
Facendo un ulteriore passo, cerchiamo di capire statisticamente cosa avviene se itero questo processo tante volte, scegliendo il numero limite in modo casuale.
Intuitivamente mi viene da pensare che scelto il numero limite e posto che abbia [tex]k_1[/tex] cifre, la sua prima cifra è sicuramente 1 o più grande. Quindi sicuramente i casi favorevoli per i numeri che iniziano con 1 sono tutti i numeri che iniziano con 1 e che hanno [tex]k_1[/tex] cifre, più quelli che iniziano con 1 e che hanno [tex]k_1-1[/tex] cifre, e via discorrendo.
Quelli che iniziano con 2 hanno la stessa probabilità solo se il numero limite ha la prima cifra almeno pari a 2, altrimenti sono meno e quindi la probabilità si abbassa, e via discorrendo per gli altri numeri.
In un certo senso questo ragionamento non chiarisce abbastanza perché statisticamente avviene quanto detto da Benford?

blackbishop13
Guardate che la prima riga della pagina sulla legge di Benford dice testualmente:

Benford's law, also called the first-digit law, states that in lists of numbers from many (but not all) real-life sources of data, the leading digit is distributed in a specific, non-uniform way


ho sottolineato real-sources of data poichè qui mica stiamo parlando di insiemi di numeri di serie di scarpe da ginnastica, o di numeri di maglia dei giocatori di pallavolo della serie B turca!
non so proprio cosa c'entri questa tanto citata legge con ciò di cui stiamo parlando.

il discorso che non va bene lavorare da $1$ a $N$: appunto, per quello ho adottato un altro approccio, che elimini questo evidente problema.

@marmi: non mi è chiarissimo perchè dici che i metodi sono equivalenti.

@Rggb: appena ho un po' più di tempo rispondo per bene alle tue richieste, grazie per l'interessamento!
Tra l'altro, non è che mi fidi nemmeno io tantissimo dei miei conti, ma il processo mi pare proprio buono ed è questo ciò che conta. dovrei mettermi lì e scriverlo per bene al computer, ma non sono un gran programmatore. comunque ci torno.

marmi1
a blackbishop13:
per il punto che mi chiedi:
mi pare che il procedimento che suggerisci, vada a discriminare -
cifra dopo cifra - quali numeri $n$ sono
$(sqrt(7)*10^k
dove $k$ corrisponde al numero di cifre di $n$.

Ciao,
Andrea

robbstark1
"alfabeta":
qual è la probabilità che un numero intero elevato al quadrato dia come risultato un numero che ha come prima cifra 7?


Premetto che non ho studiato teoria delle probabilità, e che le mie conoscenze in merito sono pressappoco quelle che ho studiato al liceo.
Credo che questa probabilità non sia definibile.
Infatti volendo calcolare la probabilità come:
$p=(n.favorevoli)/(n.possibili)$ si ha un rapporto di infiniti. Allora l'idea più naturale può sembrare quella di calcolare $lim_{n->+infty} p|[0,n]$. Questo limite non esiste.



Inoltre è stato fatto già osservare che in questo modo, la probabilità che un numero cominci per $1$, segue un andamento diverso dalla probabilità che un numero cominci per $7$, e per di più la probabilità che un numero cominci per $1$ è sempre maggiore o uguale alla probabilità che cominci per $7$. Questo dipende chiaramente dall'ordinamento naturale dei numeri. Se si ordinassero in modo diverso si otterrebbero risultati diversi. Quindi in sostanza il problema è: "Come fare a definire la probabilità di estrazione di una classe di numeri, da un insieme INFINITO e ILLIMITATO?"

Rggb1
"robbstark":
Quindi in sostanza il problema è: "Come fare a definire la probabilità di estrazione di una classe di numeri, da un insieme INFINITO e ILLIMITATO?"

E' proprio questo il punto, che mi convince della correttezza formale dell'approccio di blackbishop13. In pratica non possiamo usare il metodo del conteggio, quindi supponiamo - ragionevolmente direi, ma forse possiamo formalizzare meglio - che ogni singola cifra (in notazione decimale) che compone un numero intero preso a caso da un universo di numeri illimitato, abbia la stessa probabilità di essere composta dalle cifre 1..9 in prima posizione e 0..9 in tutte le altre posizioni.

Possiamo forse dimostrare (intuitivamente) questo fatto con un esempio:
- prendo due numeri a caso con il mio pc usando un generatore pseudorandom della calcolatrice
- uso la parte frazionaria ed ottengo 15251635 e 815817765, analizzo gli interi fra questi estremi
- ottengo il 13,08% di numeri che iniziano per uno, i numeri che iniziano per 2..7 sono ciascuno il 13,74% del totale, i numeri che iniziano per 8 sono solamente il 3,22% e quelli per 9 solamente (addirittura) 1,25%

Cioè, se vogliamo implementare un algoritmo che simuli la nostra probabilità questa secondo me è una strada, prendo una "fetta" casuale dell'insieme degli interi e faccio i conteggi, ripeto l'esperimento per un numero sufficientemente grande di prove e faccio una media. Sono pronto a scommettere euro contro fagioli che, contando le percentuali dei numeri "che iniziano per" queste convergono allo stesso identico valore, e se calcoliamo i quadrati ci avviciniamo al risultato trovato da blackbishop13.

robbstark1
Vediamo se ho capito l'approccio di blackbishop13, perchè ho qualche dubbio sui conti.

A 1 cifra:
inizi certi: nessuno
inizi dubbi: 2, 8
probabilità: $0 +- rho 2/9$

A 2 cifre:
inizi certi: 27, 28, 84, 85, 86, 87, 88, 89
inizi dubbi: 26, 83
probabilità: $8/90 +- rho 2/90$

A 3 cifre:
inizi certi: da 265 a 282, da 837 a 894
inizi dubbi: 264, 836
probabilità: $76/900 +- rho 2/900$

Così i conti tornano solo a 2 cifre.

Inoltre non capisco perchè mettere l'incertezza, visto che stiamo lavorando con numeri interi, per cui non ci interessa indagare sulla parte decimale.
Infine, se proprio indaghiamo sulla parte decimale, anche gli estremi superiori (83, 28, 282, 894) sono affetti da incertezza, per cui avrei incertezze doppie.

marmi1
Ciao,

io ho capito un poco diversamente:

considero i numeri di m cifre, ossia i numeri $ 10^(m-1) <= n < 10^m $

Ora procedo come segue: considero le $k$ cifre piu' significative:

esisteranno 4 numeri di k (escluso k=1) cifre per cui al variare delle restanti $m-k$ cifre
avro' interi che soddisfano la condizione e altri che non la soddisfano.

prima cifra:
$2 vv 8$ in "media" 1 (0.5+0.5) al minimo 0 al massimo 2
0 se nessun numero che inizia per 2 o per 8 soffisfa la condizione
2 se tutti i numeri che iniziano per 2 e per 8 soddisfano la condizione
quindi $p = 1/9 +- 1/9$

seconda cifra:
26, 28, 83, 89 sono i 4 numeri citati sopra ed avro`:

$p = (0.5+1+0.5+0.5+5+0.5 +-2)/90= 8/90 +- 2/90 $

terza cifra:
i 4 numeri sono 264, 282, 836, 894

$p= (0.5+17+0.5+0.5+57+0.5 +-2)/900 = 76/900 +-2/900 $

e cosi' via.

ribadisco che questo procedimento approssima sempre meglio
$sqrt(7)*10^(k-1), sqrt(8)*10^(k-1), sqrt(70)*10^(k-1), sqrt(80)*10^(k-1)$

ritengo che questo approccio selezioni implicitamente i numeri interi:
$ 10^(m-1) <= n < 10^m $

che puo' essere una buona scelta, ma resta una scelta discrezionale.

Ciao,
Andrea

luigi_rafaiani
"blackbishop13":
io ho seguito un'altra strada.
....

E allora alla terza cifra viene un risultato già interessante per il piccolo margine di errore, meno dello [tex]$0.5 \%$[/tex] ed è [tex]$P^{\left( 3 \right)} = 0.07\bar{3} \pm \rho \cdot 0.0\bar{2}$[/tex]. Ovvero da un minimo di [tex]$0.07\bar{1}$[/tex] a un massimo di [tex]$0.07\bar{5}$[/tex]. Andando avanti con analisi alle cifre successive, si può ottenere il margine voluto ovviamente.
è interessante che la probabilità è meno di quel che ci si aspetta, come dice Rggb, ovvero [tex]$0.\bar{1}=\frac{1}{9}$[/tex].
se qualcuno fosse interessato (sono un illuso?) posso spiegare meglio il mio ragionamento.
Scusate per la lunghezza.


Seguirei il ragionamento di blackbishop13 che ritengo giusto passando direttamente ai numeri reali:

Consideriamo i reali tra $ 1 $ e $ 9,bar(9) $.
Quali di questi numeri hanno il quadrato che inizia con la cifra 7?

La risposta è già stata detta più o meno esplicitamente più volte e cioè: i numeri tra $ sqrt(7) $ e $ sqrt(8) $ e i numeri tra $ sqrt(70) $ e $ sqrt(80) $

Quindi la probabilità di avere un numero il cui quadrato inizia con il 7 sarà: $ ( sqrt(8) - sqrt(7) + sqrt(80) - sqrt(70) ) / 9 $

Numericamente si avrà (approx) $ ( 0,18267581 + 0,57767164 ) / 9 $ per un totale di $ 0,08448305 $

Allo stesso modo si potrebbero calcolare le probabilità per ogni altra cifra.

Dove potrebbe sorgere il problema?

Umby2
"luigi_rafaiani":

Allo stesso modo si potrebbero calcolare le probabilità per ogni altra cifra.



Anche andando in questa direzione, ritorni sul punto di Cenzo, ovvero che le prime cifre sono più probabili ( e questo intuitivamente è comprensibile in quanto nella stesso spazio, parlando di quadrati, ne cadono di piu quando i numeri son piccoli).

Ottieni qualcosa di questo tipo (puoi anche andare avanti, verificando numeri piu' grandi).



La riga 19 (0,760347), rappresenta il calcolo che hai gia' fatto, la 20 è la percentuale. Lo schema mostra come le % diminuiscono.
La sommatoria della riga 19 è ovviamente 9 (abbiamo considerato i numero che vanno da 1 a 10)
Mentre la somma della 20 è ovviamente 100.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.