Teorema di Bayes??

giackk83
Salve a tutti,

avrei da chiedere un grosso piacere.......

dove posso trovare qualche spiegazione sul teorema di bayes??

Perchè tale teorema viene applicato al riconoscimento dello spam, ed è giusto dire che afferma che la probabilità che un evento si verifichi in futuro è dedotta dalla frequenza delle volte in cui esso compare nel passato??

Risposte
_Tipper
Qualche appunto lo trovi qui, clicchi su Teaching e poi su Statistica 2004/05, in fondo alla pagina ci sono le note delle lezioni. Ma non so se può far davvero al caso tuo...

codino75
"giackk83":
Salve a tutti,

avrei da chiedere un grosso piacere.......

dove posso trovare qualche spiegazione sul teorema di bayes??

Perchè tale teorema viene applicato al riconoscimento dello spam, ed è giusto dire che afferma che la probabilità che un evento si verifichi in futuro è dedotta dalla frequenza delle volte in cui esso compare nel passato??


se ti sente De Finetti.... (noto bayesiano :-))) )

giackk83
Grazie per le risposte...

da quello che deduco quindi il fatto della probabilità di un evento futuro è una gran bip bip :-)???????????

antrope
Basta pensare al lotto.. Se un numero non viene estratto per 200 estrazioni la sua probabilità di uscire è sempre la stessa dalla prima alla 200esima :D Non ha senso..

gugo82
"giackk83":
Perchè il teorema di Bayes viene applicato al riconoscimento dello spam, ed è giusto dire che afferma che la probabilità che un evento si verifichi in futuro è dedotta dalla frequenza delle volte in cui esso compare nel passato??

Per fare un po' di chiarezza cito gli appunti dalle lezioni del mio corso di Calcolo delle Probabilità:
[quote]Legge di Bayes
Sia ${H_i}_(iin I)$ un insieme completo di alternative per lo spazio di probabilità $(Omega,F,P)$.
Comunque si fissi un evento $Bin F$ con $P(B)>0$ risulta:

(*) $quad AA iin I,quad P(H_i|B)=(P(B|H_i)*P(H_i))/(\sum_(j in I)P(B|H_j)*P(H_j))$.

[...]
La legge di Bayes assume un significato particolare se si attribuiscono agli eventi $H_i$ ($i in I$) e $B$ i ruoli di "cause" ed "effetto". Precisamente, se chiamiamo cause gli eventi dell'insieme di alternative ${H_i}_(i in I)$ ed effetto l'evento $B$, le probabilità $P(H_i)$ e $P(H_i|B)$ si possono considerare rispettivamente come probabilità a priori ed a posteriori (rispetto a $B$) degli eventi $H_i$: la Legge di Bayes permette allora di determinare le probabilità a posteriori degli eventi $H_i$ supponendo già note le probabilità delle cause ${H_i}_(i in I)$ e tutte le probabilità condizionate $P(B|H_i)$. Di conseguenza la (*) dà una misura di quale tra le alternative $H_i$ è stata con maggiore probabilità la causa che ha provocato l'effetto $B$, supposto che $B$ si sia verificato.
Tale interpretazione può generare errori ed equivoci se usata, ad esempio, nel contesto di fenomeni deterministici e non con specifico riferimento ad uno spazio di probabilità.
[/quote]

Non so come venga evitato algoritmicamente lo spam, ma spero ti sia stato utile leggere queste poche righe. :wink:

Fioravante Patrone1
"giackk83":
Grazie per le risposte...

da quello che deduco quindi il fatto della probabilità di un evento futuro è una gran bip bip :-)???????????


"antrope":
Basta pensare al lotto.. Se un numero non viene estratto per 200 estrazioni la sua probabilità di uscire è sempre la stessa dalla prima alla 200esima :D Non ha senso..


Attenzione, antrope, ma le cose sono un po' meno semplici di come appaiono a prima vista.
Tra l'altro, come mostra il fatto accaduto sui numeri caldi al lotto, non è proprio così scontato che i numeri del lotto siano proprio così equiprobabili.

Gli appunti di Paoletti (carini, questi manoscritti moderni) mostrano, pur nella loro estrema sintesi, attenzione a questo problema. Vedi ultima domanda di pag. 1 ed Eserc. 2 a pag. 7 di http://www.dii.unisi.it/~paoletti/teach ... io2005.pdf

Non farti traviare da uno scientismo di facciata, come capita a taluni (spesso sono ingegneri(*) o aspiranti tali) che sono travolti, nella loro formazione, da troppa tecnica e rischiano di trasformarsi in novelli cacciatori di streghe.

giackk83, l'assegnazione di un valore di probabilità al verificarsi di un evento "futuro"(**) è una delle cose più difficili da fare. E coinvolge problematiche non banali di natura fondamentale. L'idea di causalità, l'induzione scientifica, fino alle cose più terra terra quali la definizione stessa di probabilità di un evento. Riguardo a quest'ultimo, faccio un po' di pubblicità ad un alto forum: http://olimpiadi.dm.unipi.it/oliForum/v ... 1121#71121


(*) [size=75]mica tutti gli ingegneri sono così. Enrico di Rovasenda http://www.matematicamente.it/forum/galileo-vt24528.html era ingegnere![/size]

(**) [size=75]metto le virgolette in quanto ciò che è determinante non è il fatto che l'evento sia futuro, quanto la informazione che noi abbiamo su quell'evento. Esempio: io ho lanciato una moneta da un euro. Quale è la probabilità che assegni al fatto che sia venuto testa?[/size]




EDIT: in "probabilità di un evento", la "probabilità" era rimasta attaccata alla tastiera

bryce1
Ciao. Il teorema di Bayes si può comprendere facilmente se si pensa ai "sintomi" e alla "malattia". Se riesci a sapere facilmente che c'é la malattia (effetto) dati certi sintomi (causa) e la probabilità

prob[ sintomi provochino la mattia ]

sotto certe condizioni potresti calcolare il contrario (conoscendo le singole probabilità di "sintomi" e "malattia"):

prob[ malattia abbia certi sintomi ]

Questo torna utile perché in certi campi scientifici si conoscono effetti chiari (la malattina) e sintomi probabili... e si cerca di capire se gli effetti sono quelli previsti da quei sintomi o meno.

Lo stessa dinamica va bene per il "cancro" associato al "fumare". Lo stesso per tutti i problemi analoghi causa/effetto dove bisogna indagare le probabili cause conoscendo gli effetti.

Circa i meccanismi anti-spam, qui si gioca allo stesso modo, cioé analizzando le possibili cause/fattori che contraddistinguono le mail spam da quelle non-spam. I fattori possono essere vari. All'inizio si considerava il contenuto del messaggio analizzando alcune parole particolari e tipiche. Poi lo spam si è raffinato con l'uso di immagini, poi con immagini contenenti testo più un meno in chiaro. Adesso come adesso, sembra che la guerra allo spam sia molto complessa e da combattere ogni giorno. Il rischio è che i filtri anti-spam marchino come "colpevoli" delle semplici e innocenti mail che vorresti ricevere.
...Opps, scusate, mi sto dilungando troppo...
In sintesi, per cultura personale, si possono usare una decina di metodi diversi per l'anti-smap, fra cui questi filtri bayesiani.

Spero di essere stato chiaro. Saluti.

leev
Se non avessi ancora dato un'occhiata in wikipedia...
http://en.wikipedia.org/wiki/Bayesian_spam_filtering

Fioravante Patrone1
"bryce":

Lo stessa dinamica va bene per il "cancro" associato al "fumare".

Ottimo esempio che mostra la delicatezza con cui va usata l'inferenza statistica.

Avendo scritto ormai migliaia di post, mi accorgo che sempre più spesso basta citarne uno: https://www.matematicamente.it/forum/-vp ... tml#165656

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.