Q:
Kenapa beberapa projek pembelajaran mesin memerlukan sejumlah besar pelaku?
A:Apabila anda berfikir tentang pembelajaran mesin, anda cenderung untuk berfikir tentang saintis data mahir yang bekerja pada papan kekunci di bilik komputer. Terdapat penekanan yang melampau terhadap analisis kuantitatif dan algoritma. Tidak ada banyak konteks dunia nyata langsung kepada banyak program ini - sekurang-kurangnya, itulah yang akan difikirkan ramai.
Walau bagaimanapun, beberapa program pembelajaran mesin yang paling mendahului hari ini telah menggunakan tentera sebenar pelaku manusia di jalan, di kedai-kedai dan di mana sahaja mereka boleh memodelkan aktiviti asas manusia seperti berjalan, bekerja atau membeli-belah.
Muat turun Percuma: Pembelajaran Mesin dan Mengapakah Ia Penting |
Artikel Berwayar oleh Tom Simonite menggambarkan hal ini dengan baik dengan tajuk "Untuk Membuat AI Lebih Cerdas, Manusia Melaksanakan Tugas Rendah Berbayar".
Menggunakan contoh video pendek yang diambil di kedai runcit Whole Foods, Simonite menyoroti jenis kerja yang akan membantu membina beberapa fasa seterusnya pembelajaran mesin.
Ini membawa kepada persoalan mengapa semua orang ini terlibat dalam penggambaran diri mereka dalam video pendek dan mudah mendokumentasikan tindakan sebagai asas seperti menggerakkan lengan atau kaki.
Jawapannya memberi sedikit pendedahan mengenai pembelajaran mesin dan di mana ia pergi.
"Para penyelidik dan usahawan ingin melihat AI memahami dan bertindak dalam dunia fizikal, " tulis Simonite, menjelaskan mengapa dia dan orang lain mengamuk dengan kamera. "Oleh itu, keperluan bagi pekerja untuk bertindak adegan di pasar raya dan rumah. Mereka menjana bahan pengajaran untuk mengajar algoritma tentang dunia dan orang-orang di dalamnya. "
Seperti yang dijelaskan oleh ramai pakar, beberapa sempadan utama pembelajaran mesin melibatkan pemprosesan imej dan pemprosesan bahasa semula jadi. Ini adalah prosedur yang sangat kuantitatif - dalam erti kata lain, tidak ada spektrum input yang luas seperti terdapat dalam persekitaran dunia "performant". Sebaliknya, program pembelajaran mesin menggunakan data visual dan audio dalam cara yang sangat spesifik untuk membina model. Dengan pemprosesan imej, ia memaparkan ciri-ciri dari bidang penglihatan (terhingga). Untuk NLP, ia memasang fonem.
Melampaui kategori input khusus ini melibatkan sesuatu yang mungkin memanggil "jurang imej dan ucapan" - dalam melampaui perkara seperti pemprosesan imej dan pengenalan pertuturan, anda bergerak ke bidang di mana komputer perlu analitis dengan cara yang berbeza. Set latihan akan secara asasnya berbeza.
Masukkan tentera videographers. Dalam beberapa projek pembelajaran mesin baru ini, idea-idea yang paling kecil dalam aktiviti manusia adalah set latihan. Daripada dilatih untuk mencari ciri dan tepi dan piksel yang menyusun tugas klasifikasi, komputer sebaliknya menggunakan video latihan untuk menilai rupa jenis tindakan yang berbeza.
Perkara utama ialah jurutera boleh lakukan dengan data ini apabila ia diagregatkan dan dimuatkan, dan apabila komputer dilatih di atasnya. Anda akan melihat hasilnya dalam pelbagai bidang - contohnya, ini akan menjadikan pengawasan sangat berkesan. Komputer akan dapat "melihat" dalam bidang visual apa yang dilakukan oleh orang ramai, dan menerapkannya kepada bidang seperti pemasaran dan penjualan, atau mungkin, dalam beberapa kes, kerja agensi kerajaan atau keadilan jenayah.
Ketidaksuburan juga memberi sedikit pendedahan mengenai perbahasan antara faedah maksimum dan soalan privasi. Kebanyakan penggunaan video ini akan membina model pembelajaran mesin yang berfungsi untuk pengawasan - tetapi bagaimana pula dengan orang-orang yang tidak mahu diinterview? Apabila program pembelajaran mesin baru ini digunakan di ruang awam, apakah hak individu dan di manakah garis itu diambil?
Walau apa pun, syarikat menggunakan jenis sumber manusia dan video ini untuk benar-benar menggali ke dalam beberapa peringkat pelajaran kemajuan mesin yang akan membolehkan komputer mengiktiraf apa yang berlaku di sekeliling mereka, bukan sekadar mengelaskan imej atau bekerja dengan fonem ucapan. Ini adalah perkembangan yang sangat menarik dan kontroversial dalam kecerdasan buatan, dan yang patut mendapat bahagian perhatiannya dalam media teknologi dan seterusnya.