Cuprins:
Definiție - Ce înseamnă filtrul Bayesian?
Un filtru Bayesian este un program de calculator care folosește logica bayesiană sau analiza bayesiană, care sunt termeni sinonimi. Este utilizat pentru a evalua antetul și conținutul mesajelor de e-mail și pentru a determina dacă acesta constituie sau nu spam - e-mail nesolicitat sau echivalentul electronic al e-mail-urilor sau al copiilor necomandate). Un filtru Bayesian este cel mai bine utilizat împreună cu programele antivirus.
Techopedia explică Filtru Bayesian
Un filtru Bayesian funcționează cu probabilități ca anumite cuvinte să apară în antetul sau conținutul unui e-mail. Anumite cuvinte indică o mare probabilitate ca e-mailul să fie spam, precum Viagra și refinanțare. Filtrul nu începe să știe probabilitatea ca un cuvânt să indice o mare probabilitate de spam. Utilizatorii trebuie să identifice manual e-mailul ca spam. Când se găsesc destule apariții ale cuvântului și e-mailul este identificat ca spam, filtrul Bayesian „învață” să identifice cuvântul folosind funcții de probabilitate. La fel se întâmplă cu multe alte cuvinte și expresii. În timp, filtrul Bayesian devine din ce în ce mai eficient în identificarea spam-ului pentru un anumit utilizator. Când probabilitatea atinge un anumit prag, cum ar fi 95 la sută, atunci e-mailul este identificat ca spam și adesea mutat într-un folder necompletat (sau uneori chiar șters automat). Utilizatorul îl poate vizualiza periodic și decide dacă îl șterge sau nu. În mod alternativ, unele programe de spam îl vor muta într-o locație de carantină unde utilizatorii pot vizualiza e-mailul și pot revizui decizia software-ului.
„Antrenamentul” inițial poate fi adesea rafinat pentru a reduce falsele pozitive sau false negative atunci când se găsesc judecăți greșite. Aceasta permite filtrului Bayesian al software-ului să se adapteze la natura în continuă evoluție a spamului.
Unele filtre spam folosesc, de asemenea, euristică împreună cu filtrul Bayesian. Regulile predefinite sunt setate de utilizator pentru a crește în continuare precizia identificării e-mailului ca spam. Aceste reguli pot implica numărul de apariții ale unui cuvânt dat, eliminarea sau ignorarea cuvintelor neutre precum „the”, „a” sau „unele” sau identificarea secvențelor de lucrări precum „Viagra este bun pentru”, spre deosebire de aplicarea unei probabilități funcționează la toate cele patru cuvinte individuale.
Spammerii pot folosi o tehnică numită intoxicație bayesiană pentru a diminua eficacitatea filtrelor de spam utilizând filtrarea bayesiană. Unele tehnici includ injectarea de texte legitime din știri sau surse literare, folosirea unor cuvinte nevinovate aleatoare, rar întâlnite în spam sau chiar înlocuirea textului cu imagini.
Mulți clienți de email dezactivează afișarea imaginilor din motive de securitate. Astfel, spam-ul poate ajunge la mai puțini destinatari.
Un filtru Bayesian care folosește logica bayesiană poate fi utilizat pentru a clasifica orice fel de date. Medicină, știință și inginerie au găsit întrebuințări. Interesant, cercetătorii științifici au speculat că chiar și creierul uman poate folosi metodologia logică bayesiană pentru a clasifica stimuli și a determina comportamente specifice de răspuns.
