Q:
Mengapa matriks kekeliruan berguna dalam ML?
A:Terdapat beberapa cara untuk membincangkan mengapa matriks kekeliruan adalah berharga dalam pembelajaran mesin (ML) - tetapi salah satu cara yang paling mudah adalah untuk menjelaskan bahawa matriks kekeliruan adalah sumber visualisasi data.
Matriks kekeliruan membolehkan penonton melihat sekilas keputusan menggunakan pengelas atau algoritma lain. Dengan menggunakan jadual mudah untuk menunjukkan hasil analisis, matriks kekeliruan pada dasarnya merendahkan output anda menjadi pandangan yang lebih mudah dihadam.
Matriks kekeliruan menggunakan istilah tertentu untuk mengatur keputusan. Terdapat positif dan negatif sebenar, serta positif palsu dan negatif palsu. Untuk matriks kekeliruan yang lebih rumit atau satu berdasarkan klasifikasi perbandingan, nilai-nilai ini mungkin ditunjukkan sebagai kelas sebenar dan diramalkan untuk dua objek yang berbeza.
Terlepas dari istilah semantik, hasilnya dikelompokkan ke dalam jadual segi empat (atau persegi panjang).
Pandangan ini memudahkan para penganalisis untuk melihat bagaimana algoritma tepat dalam mengklasifikasikan hasil. (Baca Penjana Baru Letakkan Algoritma Moden untuk Bekerja pada Art ASCII.)
Penggunaan matriks kekeliruan ada kaitan dengan kerumitan projek ML, dan juga dengan cara maklumat diformat dan dihantar kepada pengguna. Bayangkan rentetan hasil linear termasuk positif palsu, negatif palsu, positif benar dan negatif yang benar. (Baca Mesin Pembelajaran 101.)
Seorang pengguna perlu membentangkan semua hasil linear ke dalam graf untuk memahami bagaimana algoritma itu berfungsi, dan betapa tepatnya itu. Dengan matriks kekeliruan, maklumat ini hanya dibentangkan dalam model visual yang kuat.
Sebagai contoh, anggap mesin diminta untuk mengklasifikasikan 20 imej, yang mana lima buah dan lima sayuran. Jika matriks kekeliruan memegang kandungan berikut (dari atas ke kiri mengikut arah jam): 7, 5, 3, 5, maka matriks menunjukkan bahawa tujuh betul dikenal pasti sebagai sayuran, manakala tiga diklasifikasikan dengan betul sebagai buah.
Yang lain 10, seperti yang diwakili, adalah hasil di mana program gagal mengenal pasti imej dengan betul.
Matriks kekeliruan akan berguna dalam pelbagai analitik ML. Dengan memerhati sumber ini, pengguna dapat mengetahui cara mengatasi masalah seperti dimensi dan overfitting, dan cara lain untuk mengoptimumkan algoritma.