Mengapa rangkaian neural berulang tiruan sering sukar dilatih?

2025

Kesukaran melatih rangkaian neural berulang buatan mempunyai kaitan dengan kerumitan mereka.

Salah satu cara yang paling mudah untuk menerangkan mengapa rangkaian neural berulang sukar dilatih adalah bahawa mereka tidak menjana rangkaian saraf.

Dalam rangkaian saraf feedforward, isyarat hanya bergerak satu arah. Isyarat bergerak dari lapisan input ke pelbagai lapisan tersembunyi, dan ke hadapan, ke lapisan output sistem.

Sebaliknya, rangkaian neural berulang dan pelbagai jenis rangkaian saraf yang lain mempunyai pergerakan isyarat yang lebih kompleks. Diklasifikasikan sebagai rangkaian "maklum balas", rangkaian neural berulang boleh mempunyai isyarat yang bergerak ke hadapan dan ke belakang, dan mungkin mengandungi pelbagai "gelung" dalam rangkaian di mana nombor atau nilai diberi makan kembali ke rangkaian. Pakar mengaitkannya dengan aspek rangkaian neural berulang yang berkaitan dengan ingatan mereka.

Di samping itu, terdapat satu lagi kompleksiti yang mempengaruhi rangkaian saraf berulang. Satu contoh yang sangat baik dalam bidang pemprosesan bahasa semulajadi.

Dalam pemprosesan bahasa semula jadi yang canggih, rangkaian saraf perlu dapat mengingati perkara. Ia juga perlu mengambil input dalam konteks juga. Katakan ada program yang ingin menganalisis atau meramalkan perkataan dalam kalimat perkataan lain. Mungkin ada, sebagai contoh, panjang lima perkataan yang tetap untuk sistem untuk dinilai. Ini bermakna rangkaian saraf perlu mempunyai input untuk setiap kata-kata ini, bersama-sama dengan keupayaan untuk "ingat" atau berlatih mengikut konteks kata-kata ini. Bagi mereka dan sebab-sebab yang serupa, rangkaian neural berulang biasanya mempunyai gelung tersembunyi dan umpan balik yang tersembunyi di dalam sistem.

Pakar merungut bahawa komplikasi ini menjadikannya sukar untuk melatih rangkaian. Salah satu cara yang paling biasa untuk menerangkan ini adalah dengan memetik masalah kecerunan yang meletup dan lenyap. Pada asasnya, berat rangkaian akan sama ada membawa kepada meletus atau menghilangkan nilai-nilai dengan sejumlah besar pas.

Perintis rangkaian neural Geoff Hinton menerangkan fenomena ini di web dengan mengatakan bahawa pas linear mundur akan menyebabkan berat yang lebih kecil untuk mengecilkan berat badan yang exponentially dan lebih besar untuk meletup.

Masalah ini, dia terus bertambah buruk dengan urutan yang panjang dan langkah-langkah lebih banyak masa, di mana isyarat tumbuh atau merosot. Berat permulaan boleh membantu, tetapi cabaran-cabaran itu dibina ke dalam model rangkaian neural berulang. Selalunya akan ada isu yang melekat pada reka bentuk dan pembinaan mereka. Pada asasnya, beberapa jenis rangkaian neural yang lebih kompleks benar-benar menentang keupayaan kami untuk menguruskannya dengan mudah. Kita boleh mencipta kerumitan yang hampir tidak terhingga, tetapi kita sering melihat cabaran ramalan dan skalabiliti berkembang.

Mengapa rangkaian neural berulang tiruan sering sukar dilatih?

Pinterest untuk perniagaan: mengapa ia lebih sukar daripada yang kelihatan

6 Kemajuan besar yang anda boleh atribut ke rangkaian saraf tiruan

Apakah rangkaian neural berulang (rnn)? - definisi dari techopedia

Pilihan Editor

Apakah mod pemindahan asynchronous (atm)? - definisi dari techopedia

Apakah v.42? - definisi dari techopedia

Apakah kos per tindakan (cpa)? - definisi dari techopedia

Apakah salinan karbon (cc atau cc)? - definisi dari techopedia

Pilihan Editor

Apakah pengurusan teknologi maklumat (pengurusannya)? - definisi dari techopedia

Apakah yang dimaksudkan dengan bot sembang perbualan internet (irc bot)? - definisi dari techopedia

Apakah array berlebihan cakera bebas (serbuan)? - definisi dari techopedia

Apa itu iTunes? - definisi dari techopedia

Pilihan Editor

Apakah yang dihadkan antara muka pengguna peranti yang terhubung (lcdui)? - definisi dari techopedia

Apa itu maemo? - definisi dari techopedia

Apakah perisian lama yang sama seperti perkhidmatan (sosaas) - definisi dari techopedia

Apakah pasukan petugas kejuruteraan internet (ietf)? - definisi dari techopedia

Pilihan Editor

Apa yang menolong? - definisi dari techopedia

Apa itu geek uber? - definisi dari techopedia

Apa yang melambai ayam mati? - definisi dari techopedia

Apa itu web texting? - definisi dari techopedia

Pilihan Editor

Apakah teknologi maju (atx)? - definisi dari techopedia

Apakah co-location (colo)? - definisi dari techopedia

Apakah perkongsian jaminan maklumat nasional (niap)? - definisi dari techopedia

Apakah php: hypertext preprocessor 4.0 (php 4)? - definisi dari techopedia

Kategori popular