Isi kandungan:
Definisi - Apakah maksud yang lebih besar?
Dalam statistik dan pembelajaran mesin, overfitting berlaku apabila model cuba untuk meramalkan trend dalam data yang terlalu bising. Berlebihan adalah hasil dari model terlalu rumit dengan terlalu banyak parameter. Model yang overfitted tidak tepat kerana trend tidak mencerminkan realiti data.
Techopedia menerangkan Overfitting
Model yang overfitted adalah model dengan garis trend yang mencerminkan kesilapan dalam data yang dilatih dengan, bukannya tepat meramalkan data yang tidak kelihatan. Ini lebih baik dilihat secara visual dengan graf mata data dan garis trend. Model yang overfitted menunjukkan lengkung dengan mata yang lebih tinggi dan lebih rendah, manakala model yang dipasang dengan betul menunjukkan keluk yang lancar atau regresi linier.
Masalah utama dengan overfitting ialah model telah berkesan menghafal mata data sedia ada daripada cuba untuk meramalkan bagaimana titik-titik data yang tidak dapat dilihat.
Berlebihan biasanya menghasilkan hasil dari jumlah latihan yang berlebihan. Terdapat beberapa teknik yang boleh digunakan oleh penyelidik pembelajaran mesin untuk mengatasi masalah yang berlebihan, termasuk pengesahan silang, regulatariasi, hentian awal, pemangkasan, prioriti Bayesian, penurunan dan perbandingan model.