Isi kandungan:
Definisi - Apa maksud Teater Penguatkan?
Pembelajaran penguat, dalam konteks kecerdasan buatan, adalah sejenis pengaturcaraan dinamik yang melatih algoritma menggunakan sistem ganjaran dan hukuman.
Algoritma pembelajaran tetulang, atau agen, belajar dengan berinteraksi dengan persekitarannya. Ejen menerima ganjaran dengan melakukan dengan betul dan penalti untuk melakukan kesalahan. Ejen itu belajar tanpa campur tangan dari manusia dengan memaksimumkan ganjarannya dan meminimumkan penaltinya.
Techopedia menerangkan Pembelajaran Penguatkuasaan
Pembelajaran penguatan adalah pendekatan pembelajaran mesin yang diilhami oleh psikologi behavioris. Ia sama dengan bagaimana seorang kanak-kanak belajar melakukan tugas baru. Pengukuhan pembelajaran berbeza dengan pendekatan pembelajaran mesin lain di mana algoritma tidak secara jelas memberitahu bagaimana untuk melaksanakan tugas, tetapi berfungsi melalui masalah sendiri.
Sebagai ejen, yang boleh menjadi kereta memandu sendiri atau program bermain catur, berinteraksi dengan persekitarannya, menerima status ganjaran bergantung pada bagaimana ia melakukan, seperti memandu ke destinasi dengan selamat atau memenangi permainan. Sebaliknya, ejen menerima penalti kerana melakukan salah, seperti pergi dari jalan atau diperiksa.
Ejen dari masa ke masa membuat keputusan untuk memaksimumkan ganjarannya dan meminimumkan penaltinya menggunakan pengaturcaraan dinamik. Kelebihan pendekatan ini untuk kecerdasan buatan ialah ia membolehkan program AI untuk belajar tanpa pengaturcara menguraikan bagaimana seorang ejen harus melaksanakan tugas itu.