Rumah Trend Kenapa penting bagi para saintis data untuk mencari ketelusan?

Kenapa penting bagi para saintis data untuk mencari ketelusan?

Anonim

Q:

Kenapa penting bagi para saintis data untuk mencari ketelusan?

A:

Ketelusan adalah penting dalam projek sains data dan program pembelajaran mesin, sebahagiannya kerana kerumitan dan kecanggihan yang memacu mereka - kerana program ini "belajar" (menghasilkan keputusan probabilistik) dan bukannya mengikuti arahan pengaturcaraan linear yang telah ditetapkan, dan kerana sebagai akibatnya, sukar untuk memahami bagaimana teknologi mencapai kesimpulan. Masalah "kotak hitam" algoritma pembelajaran mesin yang tidak dijelaskan sepenuhnya kepada pembuat keputusan manusia adalah yang besar dalam bidang ini.

Dengan itu, dapat menguasai pembelajaran mesin yang dijelaskan atau "dijelaskan AI" mungkin akan menjadi tumpuan utama bagaimana syarikat menerapkan pemerolehan bakat untuk seorang saintis data. Sudah DARPA, institusi yang membawa kita internet, membiayai kajian bernilai jutaan dolar dalam AI yang dijelaskan, cuba mempromosikan kemahiran dan sumber yang diperlukan untuk mencipta pembelajaran mesin dan teknologi perisikan buatan yang telus kepada manusia.

Salah satu cara untuk memikirkannya ialah sering terdapat "tahap literasi" pembangunan bakat dan "tahap hiperliterasi." Untuk seorang saintis data, peringkat celik huruf tradisional akan menjadi pengetahuan tentang cara menyusun program pembelajaran mesin dan cara membina algoritma dengan bahasa seperti Python; bagaimana untuk membina rangkaian saraf dan bekerja dengan mereka. Tahap hyperliteracy adalah keupayaan untuk menguasai AI yang dijelaskan, untuk memberikan ketelusan dalam penggunaan algoritma pembelajaran mesin dan untuk mengekalkan ketelusan sebagai program-program ini bekerja ke arah matlamat mereka dan tujuan para penangan mereka.

Satu lagi cara untuk menjelaskan kepentingan ketelusan dalam sains data adalah bahawa set data yang digunakan terus menjadi lebih canggih, dan oleh itu lebih berpotensi mengganggu kehidupan manusia. Satu lagi pemacu utama yang boleh dijelaskan pembelajaran mesin dan sains data adalah Peraturan Perlindungan Data Umum Eropah yang baru-baru ini dilaksanakan untuk cuba untuk membendung penggunaan data peribadi yang tidak beretika. Menggunakan GDPR sebagai kes ujian, pakar dapat melihat bagaimana keperluan untuk menerangkan projek sains data sesuai dengan privasi dan kebimbangan keselamatan, serta etika perniagaan.

Kenapa penting bagi para saintis data untuk mencari ketelusan?