Q:
Kenapa pemilihan ciri begitu penting dalam pembelajaran mesin?
A:Pemilihan ciri sangat penting dalam pembelajaran mesin terutamanya kerana ia berfungsi sebagai teknik asas untuk mengarahkan penggunaan pemboleh ubah kepada apa yang paling berkesan dan berkesan untuk sistem pembelajaran mesin yang diberikan.
Pakar bercakap mengenai bagaimana pemilihan ciri dan ciri pengekstrakan berfungsi untuk meminimumkan lakaran dimensi atau membantu menangani overfitting - ini adalah cara yang berbeza untuk menangani idea pemodelan yang terlalu rumit.
Muat turun Percuma: Pembelajaran Mesin dan Mengapakah Ia Penting |
Cara lain untuk mengatakan ini adalah pemilihan ciri yang membantu memberikan pembangun alat untuk menggunakan hanya data yang paling relevan dan bermanfaat dalam set latihan pembelajaran mesin, yang secara dramatik mengurangkan kos dan jumlah data.
Salah satu contoh adalah idea untuk mengukur bentuk kompleks pada skala. Sebagai skala program, ia mengenal pasti lebih banyak titik data dan sistem menjadi lebih kompleks. Tetapi bentuk kompleks bukanlah set data tipikal yang digunakan oleh sistem pembelajaran mesin. Sistem-sistem ini boleh menggunakan set data yang sangat berbeza tahap varians antara pembolehubah yang berbeza. Sebagai contoh, dalam mengelaskan spesies, jurutera boleh menggunakan pemilihan ciri untuk hanya mengkaji pemboleh ubah yang akan memberi mereka hasil yang paling disasarkan. Sekiranya setiap haiwan dalam carta mempunyai bilangan mata atau kaki yang sama, data tersebut boleh dikeluarkan, atau mata data lain yang lebih relevan dapat diekstrak.
Pemilihan ciri adalah proses diskriminasi oleh mana jurutera mengarahkan sistem pembelajaran mesin ke arah sasaran. Di samping idea untuk menghapuskan kerumitan dari sistem secara berskala, pemilihan ciri juga boleh digunakan untuk mengoptimumkan aspek apa yang disebut oleh ahli-ahli "pertukaran varians bias" dalam pembelajaran mesin.
Sebab mengapa pemilihan ciri membantu dengan berat sebelah dan analisis varians lebih rumit. Satu kajian dari Universiti Cornell mengenai pemilihan ciri, variasi bias dan pembungkusan berfungsi untuk menggambarkan bagaimana projek-projek bantuan memilih projek.
Menurut penulis, kertas itu "mengkaji mekanisme di mana pemilihan ciri meningkatkan ketepatan pembelajaran diawasi."
Kajian selanjutnya menyatakan:
Analisis bias / varians empirikal apabila pemilihan ciri berlangsung menunjukkan bahawa set ciri yang paling tepat sepadan dengan titik tradeoff bias-varians terbaik untuk algoritma pembelajaran.
Dalam membincangkan penggunaan perkaitan yang kuat atau lemah, penulis bercakap mengenai pemilihan ciri sebagai "kaedah pengurangan varians" - ini masuk akal apabila anda memikirkan varians sebagai asasnya jumlah variasi dalam pembolehubah yang diberikan. Sekiranya tidak terdapat sebarang varians, titik data atau array mungkin pada asasnya tidak berguna. Sekiranya terdapat varians yang sangat tinggi, ia boleh menyumbang kepada apa yang difikirkan oleh jurutera sebagai "bunyi bising" atau keputusan tidak sewenang-wenang dan sewenang-wenang yang sukar untuk sistem pengurusan mesin untuk dikendalikan.
Memandangkan ini, pemilihan ciri adalah bahagian asas reka bentuk dalam pembelajaran mesin.