Determinare se una sequenza è casuale

gcm.kf
Buonasera a tutti,

Sono incappato in questo problema, forse con soluzione nota, ma che purtroppo non riesco a trovare.
Spero che qualcuno un po' più sveglio di me riesca ad indicarmi la strada.

Ho una sequenza di 0 ed 1, composta da circa 300 elementi (ovvero,$0101101... $) e mi sto chiedendo se posso stabilire se tale sequenza è casuale o meno. O meglio, per essere più precisi, vorrei stabilire con quale probabilità tale sequenza è una sequenza casuale o meno.

Ad esempio se la sequenza fosse una ripetizione del tipo $11111111....$ (per 300 volte) potrebbe evidentemente essere il risultato di una estrazione casuale, ma di fatto sarei portato a pensare che la sequenza non è stata generata da un generatore di numeri casuali.
Un discorso analogo può essere evidentemente ripetuto per sequenze del tipo: $10101010101$,$ 000111000111000111$
Come faccio, dunque, a trovare un metodo oggettivo per stabilire con quale probabilità quella sequenza può essere uscita da un generatore di numeri casuali o meno.

P.S. Quando parlo di generatori di numeri casuali mi riferisco a generatori ideali di numeri casuali.

Vi ringrazio per la disponibilità e per delle eventuali risposte.

Buona serata

Risposte
matteo1113
Esiste un particolare test detto testo delle successioni.

Ne trovi una spiegazione ad esempio a questo link

http://www.genopomii.unina.it/genohort/ ... lo%203.pdf

gcm.kf
Grazie mille! Gli do subito un occhiata

markowitz
Come alternativa, a mio parere più intuitiva, puoi anche considerare la successione completa come una serie storica unica e calcolare l'autocorrelazione a vari ordini. Ad esempio al primo ordine prendi il vettore completo (dimensione $n$) e togli la realizzazione iniziale, da una parte, e quella finale, dall'altra. Allora hai 2 vettori di dimensione $n-1$ e calcoli la correlazione.
Per serie del tipo:
1) $0101010101...$ trovi correlazioni molto negative (se la sequenza è in alternanza perfetta $-1$.
2) $0000011111...$ trovi correlazioni molto positive anche se i "blocchi" sono più di due.

se la serie è "pienamente casuale" non deve avere memoria e quindi le autocorrelazioni dovrebbero essere non significativamente diverse da zero a qualsiasi ordine.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.