Rumah Audio Apakah perbezaan di antara pembelajaran yang diselia, tidak diselia dan separuh diselia?

Apakah perbezaan di antara pembelajaran yang diselia, tidak diselia dan separuh diselia?

Anonim

Q:

Apakah perbezaan di antara pembelajaran yang diselia, tidak diselia dan separuh diselia?

A:

Perbezaan utama antara pembelajaran yang diselia dan tidak terjejas dalam pembelajaran mesin adalah penggunaan data latihan.

Pembelajaran yang diselia menggunakan data contoh untuk menunjukkan apa yang "betul" data kelihatan seperti. Data berstruktur untuk menunjukkan output input yang diberikan.

Algoritma pembelajaran mesin yang mengklasifikasikan buah-buahan mungkin mempunyai gambar buah-buahan seperti epal, pisang, anggur dan oren sebagai input dan nama buah-buahan sebagai output.

Contoh dunia nyata adalah penapis spam Bayesian dalam program e-mel. Penapis ini dilatih dengan contoh e-mel yang dianggap spam. Penapis spam kemudian boleh mencari frasa tertentu yang muncul dalam e-mel yang terjadi dalam e-mel spam dan memindahkannya ke folder spam.

Ia seperti menunjukkan manusia bagaimana melakukan tugas baru. Seseorang yang melakukan kemasukan data mungkin menunjukkan contoh-contoh data dalam format yang dikehendaki oleh syarikat itu dan kemudiannya diharapkan untuk mengikutinya.

Program pembelajaran mesin menggunakan pembelajaran diawasi berulang kali dengan data latihan. Hasilnya boleh mengesankan apabila ia benar-benar berlaku. Penapis spam Gmail Google sangat tepat kerana terdapat banyak pengguna yang melatihnya.

Pembelajaran tanpa pengawasan tidak mempunyai data latihan terdahulu. Dalam contoh klasifikasi buah kami, algoritma hanya boleh ditunjukkan gambar buah-buahan dan diberitahu untuk mengklasifikasikannya.

Pembelajaran tanpa pengawasan mempunyai aplikasi dalam penyelidikan pasaran dengan mempelajari tabiat pembelian pelanggan, atau keselamatan dengan memantau pola hacking.

Semi-penyelia pembelajaran cuba untuk mengambil jalan tengah dengan pelabelan beberapa data. Sebagai contoh, epal dan oren mungkin dilabelkan dalam program klasifikasi buah, tetapi pisang dan anggur tidak.

Apabila menggunakan mana-mana algoritma ini, bergantung pada jenis data yang digunakan. Sesetengah tugas mempunyai corak yang stabil, seperti penipuan kad kredit atau mesej spam. Pembelajaran yang diselia sesuai untuk jenis tugas ini. Serangan rangkaian tidak dapat diprediksi, dan kaedah pembelajaran yang tidak diselia atau semi-diselia mungkin lebih sesuai.

Apakah perbezaan di antara pembelajaran yang diselia, tidak diselia dan separuh diselia?