Isi kandungan:
Definisi - Apakah penanda Bayesian?
Penapis Bayesian adalah program komputer yang menggunakan logik Bayesian atau analisis Bayesian, yang merupakan istilah sinonim. Ia digunakan untuk menilai tajuk dan kandungan mesej e-mel dan menentukan sama ada atau tidak ia mengandungi spam - e-mel yang tidak diminta atau setara elektronik bagi surat pukal hard copy atau mel sampah). Penapis Bayesian paling baik digunakan bersama-sama dengan program anti-virus.
Techopedia menerangkan Penapis Bayesian
Penapis Bayesian berfungsi dengan kebarangkalian kata-kata tertentu yang terdapat dalam tajuk atau kandungan e-mel. Kata-kata tertentu menunjukkan kebarangkalian yang tinggi bahawa e-mel adalah spam, seperti Viagra dan membiayai semula. Penapis tidak bermula mengetahui kemungkinan bahawa perkataan menunjukkan kebarangkalian spam yang tinggi. Pengguna mesti mengenal pasti e-mel secara manual sebagai spam. Apabila terdapat kejadian yang mencukupi dan e-mel dikenalpasti sebagai spam, penapis Bayesian "belajar" untuk mengenal pasti perkataan yang menggunakan fungsi kemungkinan. Ia sama dengan banyak perkataan dan frasa lain. Dari masa ke masa, penapis Bayesian menjadi lebih berkesan untuk mengenal pasti spam bagi pengguna tertentu. Apabila kebarangkalian mencapai ambang tertentu, seperti 95 peratus, maka email tersebut dikenalpasti sebagai spam dan sering dipindahkan ke folder sampah (atau terkadang dihapuskan secara automatik). Pengguna boleh melihatnya secara berkala dan membuat keputusan sama ada untuk memadamkan atau tidak. Sebaliknya, beberapa program spam akan mengalihkannya ke lokasi kuarantin di mana pengguna boleh melihat e-mel dan menyemak keputusan perisian.
"Latihan awal" sering dapat disempurnakan untuk mengurangkan positif palsu atau negatif palsu apabila pertimbangan yang salah dijumpai. Ini membolehkan penapis Bayesian perisian untuk menyesuaikan diri dengan sifat spam yang sentiasa berubah.
Beberapa penapis spam juga menggunakan heuristik bersama penapis Bayesian. Peraturan yang telah ditetapkan adalah persediaan oleh pengguna untuk meningkatkan lagi ketepatan mengenal pasti e-mel sebagai spam. Peraturan ini mungkin melibatkan bilangan kejadian perkataan tertentu, menghapuskan atau mengabaikan kata-kata neutral seperti ", " "a" atau "beberapa" atau mengenal pasti urutan kerja seperti "Viagra adalah baik untuk, " berbanding dengan memohon kemungkinan berfungsi untuk semua empat kata-kata individu.
Spammer boleh menggunakan teknik yang dikenali sebagai keracunan Bayes untuk merendahkan keberkesanan penapis spam menggunakan penapisan Bayesian. Sesetengah teknik termasuk menyuntik teks yang sah dari berita atau sumber sastera, menggunakan kata-kata tidak bersifat rawak yang jarang ditemui dalam spam atau menggantikan teks dengan gambar.
Ramai pelanggan e-mel tidak dapat memaparkan gambar kerana alasan keselamatan. Oleh itu, spam boleh mencapai kurang penerima.
Penapis Bayesian menggunakan logik Bayesian boleh digunakan untuk mengklasifikasikan apa-apa jenis data. Perubatan, sains, dan kejuruteraan semua telah menemui kegunaan. Menariknya, penyelidik saintifik telah membuat spekulasi bahawa walaupun otak manusia boleh menggunakan metodologi logik Bayesian untuk mengelaskan rangsangan dan menentukan tingkah laku tindak balas tertentu.
