Rumah Trend Apa cara mudah untuk menerangkan berat sebelah dan varians dalam pembelajaran mesin?

Apa cara mudah untuk menerangkan berat sebelah dan varians dalam pembelajaran mesin?

Anonim

Q:

Apa cara mudah untuk menerangkan berat sebelah dan varians dalam pembelajaran mesin?

A:

Terdapat beberapa cara rumit untuk menerangkan berat sebelah dan varians dalam pembelajaran mesin. Ramai daripada mereka menggunakan persamaan matematik yang sangat kompleks dan menunjukkan melalui cara menggambarkan bagaimana contoh khusus mewakili pelbagai jumlah bias dan varians.

Berikut adalah cara mudah untuk menerangkan bias, varians dan bias / varians trade-off dalam pembelajaran mesin.

Pada terasnya, berat sebelah adalah terlalu banyak. Ia boleh menjadi penting untuk menambah definisi bias beberapa andaian atau ralat yang diandaikan.

Sekiranya keputusan yang berat sebelah tidak bermasalah - jika ia adalah wang - ia akan menjadi sangat tepat. Masalahnya adalah bahawa model yang dipermudahkan mengandungi beberapa kesilapan, jadi ia bukan pada bull's-eye - kesilapan yang ketara terus mendapat pengulangan atau diperkuat sebagai program pembelajaran mesin berfungsi.

Takrifan mudah varians adalah bahawa hasilnya terlalu tersebar. Ini sering menyebabkan kelebihan program dan masalah antara ujian dan latihan.

Varians yang tinggi bermakna bahawa perubahan kecil mencipta perubahan besar dalam output atau keputusan.

Satu lagi cara untuk menguraikan varians ialah terlalu banyak bunyi dalam model, dan oleh itu ia menjadi lebih sukar untuk program pembelajaran mesin untuk mengasingkan dan mengenal pasti isyarat sebenar.

Oleh itu, salah satu cara paling mudah untuk membandingkan kecenderungan dan varians ialah mencadangkan agar jurutera pembelajaran mesin terpaksa berjalan dengan baik di antara kelebihan berat sebelah atau oversimplification, dan terlalu banyak varians atau overcomplexity.

Satu lagi cara untuk mewakili ini dengan baik adalah dengan carta empat kuadran menunjukkan semua kombinasi variasi yang tinggi dan rendah. Dalam kekurangan kuadrat / kuadran varians yang rendah, semua keputusan dikumpulkan bersama dalam kluster yang tepat. Dalam keputusan bias yang rendah / rendah, semua keputusan dikumpulkan bersama dalam kluster yang tidak tepat. Dalam keputusan bias / tinggi yang bervariasi rendah, hasilnya tersebar di sekitar titik pusat yang akan mewakili gugusan yang tepat, manakala dalam keputusan bias / tinggi yang tinggi, mata data kedua-duanya bertaburan dan secara kolektif tidak tepat.

Apa cara mudah untuk menerangkan berat sebelah dan varians dalam pembelajaran mesin?