Rumah Audio Mengapa pembelajaran separuh diawasi merupakan model yang berguna untuk pembelajaran mesin?

Mengapa pembelajaran separuh diawasi merupakan model yang berguna untuk pembelajaran mesin?

Anonim

Q:

Mengapa pembelajaran separuh diawasi merupakan model yang berguna untuk pembelajaran mesin?

A:

Semi-penyelia pembelajaran adalah bahagian penting pembelajaran mesin dan proses belajar mendalam, kerana ia memperluas dan meningkatkan keupayaan sistem pembelajaran mesin dengan cara yang signifikan.

Pertama, dalam industri pembelajaran mesin baru hari ini, dua model telah muncul untuk latihan komputer: Ini dipanggil pembelajaran di bawah seliaan dan tanpa pengawasan. Mereka secara asasnya berbeza dalam pembelajaran yang diawasi melibatkan penggunaan data berlabel untuk membuat keputusan, dan pembelajaran tanpa pengawasan melibatkan ekstrapolasi dari data tanpa label dengan memeriksa sifat-sifat setiap objek dalam satu set data latihan.

Muat turun Percuma: Pembelajaran Mesin dan Mengapakah Ia Penting

Pakar menjelaskan perkara ini dengan menggunakan banyak contoh yang berbeza: Sama ada objek dalam set latihan adalah buah-buahan atau bentuk berwarna atau akaun klien, kesamaan dalam pembelajaran diawasi adalah bahawa teknologi bermula mengetahui apa objek tersebut - klasifikasi utama telah dibuat . Sebaliknya, dalam pembelajaran tanpa pengawasan, teknologi melihat item yang masih belum ditentukan dan mengklasifikasikannya mengikut kriteria penggunaannya sendiri. Ini kadang-kadang disebut sebagai "pembelajaran sendiri."

Oleh itu, ini merupakan utiliti utamanya bagi pembelajaran separuh diselia: Ia menggabungkan penggunaan data berlabel dan tidak berlabel untuk mendapatkan pendekatan "yang terbaik daripada kedua-duanya".

Pembelajaran yang diawasi memberikan arah yang lebih banyak untuk teknologi, tetapi ia boleh menjadi mahal, intensif buruh, membosankan dan memerlukan lebih banyak usaha. Pembelajaran tanpa pengawasan adalah lebih "automatik", tetapi keputusannya boleh kurang tepat.

Oleh itu, dalam menggunakan satu set data berlabel (selalunya satu set yang lebih kecil dalam skema besar sesuatu) pendekatan pembelajaran yang diselia secara semi-berkesan "prima" sistem untuk mengklasifikasikan lebih baik. Misalnya, sistem pembelajaran mesin cuba mengenal pasti 100 item mengikut kriteria binari (hitam vs putih). Ia boleh menjadi sangat berguna hanya untuk mempunyai satu contoh berlabel setiap (satu putih, satu hitam) dan kemudian cluster baki "kelabu" item mengikut mana-mana kriteria yang terbaik. Sebaik sahaja kedua-dua item tersebut dilabelkan, walaupun, pembelajaran tanpa pengawasan menjadi pembelajaran separuh diselia.

Dalam mengarahkan pembelajaran separuh diselia, jurutera melihat dengan dekat batas-batas keputusan yang mempengaruhi sistem pembelajaran mesin untuk mengklasifikasikan ke arah satu atau hasil berlabel lain ketika menilai data tanpa berlabel. Mereka akan berfikir tentang cara terbaik untuk menggunakan pembelajaran separuh diselia dalam mana-mana pelaksanaan: Contohnya, algoritma pembelajaran yang diawasi separuh boleh "membungkus" algoritma unsup sedia ada untuk pendekatan "satu-dua".

Pengajian seminari yang diselia sebagai fenomena pasti akan mendorong sempadan pembelajaran komputer ke depan, kerana ia membuka pelbagai kemungkinan baru untuk sistem pembelajaran mesin yang lebih berkesan dan lebih efisien.

Mengapa pembelajaran separuh diawasi merupakan model yang berguna untuk pembelajaran mesin?