Rumah Audio Bagaimanakah para jurutera dapat menilai set latihan dan set ujian untuk mengesan kemungkinan penggunaan yang lebih besar dalam pembelajaran mesin?

Bagaimanakah para jurutera dapat menilai set latihan dan set ujian untuk mengesan kemungkinan penggunaan yang lebih besar dalam pembelajaran mesin?

Anonim

Q:

Bagaimanakah para jurutera dapat menilai set latihan dan set ujian untuk mengesan kemungkinan penggunaan yang lebih besar dalam pembelajaran mesin?

A:

Untuk memahami bagaimana ini dilakukan, perlu untuk memahami asas peranan set data yang berbeza dalam projek pembelajaran mesin tipikal. Set latihan ditetapkan untuk memberikan teknologi rujukan rujukan - garis dasar data yang digunakan oleh program untuk membuat keputusan ramalan dan probabilistik. Set ujian adalah di mana anda menguji mesin keluar pada data.

Overfitting adalah sindrom dalam pembelajaran mesin dimana model tidak sepenuhnya sesuai dengan data atau tujuannya.

Muat turun Percuma: Pembelajaran Mesin dan Mengapakah Ia Penting

Salah satu perintah yang menyeluruh mengenai pembelajaran mesin adalah bahawa data latihan dan data ujian harus set data terpisah. Terdapat satu konsensus yang agak luas tentang ini, sekurang-kurangnya dalam banyak aplikasi, kerana beberapa masalah tertentu dengan menggunakan set yang sama yang anda gunakan untuk latihan untuk menguji program pembelajaran mesin.

Apabila program pembelajaran mesin menggunakan satu set latihan, yang boleh dipanggil pada dasarnya satu set input, ia berfungsi bahawa latihan ditetapkan untuk membuat keputusan mengenai keputusan ramalan. Satu cara yang sangat asas untuk memikirkannya ialah set latihan adalah "makanan" untuk proses pengkomputeran intelektual.

Sekarang apabila set yang sama digunakan untuk ujian, mesin sering dapat mengembalikan hasil yang sangat baik. Itu kerana ia telah melihat data sebelum ini. Tetapi matlamat keseluruhan mesin pembelajaran dalam banyak kes adalah untuk membuat keputusan mengenai data yang belum pernah dilihat sebelumnya. Program pembelajaran mesin tujuan umum dibuat untuk beroperasi pada set data yang pelbagai. Dalam erti kata lain, prinsip pembelajaran mesin adalah penemuan, dan anda biasanya tidak mendapat banyak daripada itu dengan menggunakan set latihan permulaan untuk tujuan ujian.

Dalam menilai set latihan dan set ujian untuk kemungkinan overfitting, jurutera mungkin menilai keputusan dan mengetahui mengapa program mungkin berbuat demikian secara berbeza pada hasil perbandingan kedua-dua set ini, atau dalam beberapa kes bagaimana mesin mungkin melakukan terlalu baik pada data latihan itu sendiri .

Dalam menceritakan beberapa masalah ini dalam pembelajaran mesin dalam sekeping 2014, Jason Brownlee di Mesin Pembelajaran Mastery menerangkan dengan cara ini:

"Model yang dipilih untuk ketepatannya dalam dataset latihan dan bukannya ketepatan pada dataset ujian yang tidak kelihatan kemungkinan besar mempunyai ketepatan yang lebih rendah pada dataset test yang tidak kelihatan, " tulis Brownlee. "Alasannya adalah bahawa model itu tidak sepertimana umum. Ia mempunyai specalized untuk struktur dalam dataset latihan (italics ditambah). Ini dipanggil overfitting, dan ia lebih berbahaya daripada yang anda fikirkan."

Dari segi istilah, anda boleh mengatakan bahawa dalam mengkhususkan dirinya kepada set data latihan, program ini menjadi terlalu tegar. Itulah cara metafora lain untuk melihat mengapa program pembelajaran mesin tidak dioptimumkan dengan menggunakan set latihan untuk set ujian. Ia juga cara yang baik untuk mendekati penilaian kedua-dua set yang berbeza itu, kerana keputusannya akan menunjukkan banyak jurutera tentang bagaimana program ini berfungsi. Anda mahu jurang yang lebih kecil antara ketepatan untuk kedua-dua model. Anda ingin memastikan bahawa sistem tidak overfed atau "ketepatan-bersatu" kepada set data tertentu, tetapi itu lebih umum dan mampu berkembang dan berkembang berdasarkan perintah.

Bagaimanakah para jurutera dapat menilai set latihan dan set ujian untuk mengesan kemungkinan penggunaan yang lebih besar dalam pembelajaran mesin?