Q:
Mengapa menjalankan latihan pembelajaran komputer (ML) pada mesin tempatan dan kemudian menjalankan pelaksanaan teratur pada pelayan?
A:Persoalan bagaimana untuk membina sebuah projek pembelajaran mesin dan fasa keretapi dan ujiannya mempunyai banyak kaitan dengan bagaimana kita bergerak melalui "kitaran hidup" ML dan membawa program dari persekitaran latihan ke persekitaran pengeluaran.
Salah satu sebab paling mudah untuk menggunakan model di atas meletakkan latihan ML pada mesin tempatan dan kemudian memindahkan pelaksanaan ke sistem berasaskan pelayan adalah manfaat pemisahan tugas yang penting. Umumnya, anda mahu latihan itu terpencil, supaya anda mempunyai gambaran jelas mengenai latihan dan berhenti, dan di mana ujian dijalankan. Artikel KDNuggets ini bercakap mengenai prinsip dalam cara yang kasar walaupun juga melalui beberapa sebab lain untuk mengasingkan set latihan pada mesin tempatan. Satu lagi cadangan asas asas untuk model ini ialah, dengan latihan dan ujian set pada seni bina yang sangat berbeza, anda tidak akan pernah keliru tentang peruntukan kereta api / ujian bersama!
Satu lagi faedah menarik berkaitan dengan keselamatan siber. Pakar menunjukkan bahawa jika anda mempunyai proses kereta api awal pada mesin tempatan, ia tidak perlu disambungkan ke internet! Ini meningkatkan keselamatan dengan cara yang mendasar, "menginkubkan" proses sehingga ia mencapai dunia pengeluaran, di mana anda perlu membina keamanan yang mencukupi ke dalam model pelayan.
Di samping itu, beberapa model "terpencil" ini dapat membantu masalah seperti hanyutan konsep dan konteks yang tersembunyi - prinsip "non-stationality" memberi amaran pemaju bahawa data tidak "tetap sama" dari masa ke masa (bergantung kepada apa yang diukur) bahawa ia boleh mengambil banyak kesesuaian untuk membuat fasa ujian sepadan dengan fasa kereta api. Atau, dalam beberapa kes, proses kereta api dan ujian menggabungkan bersama, menyebabkan kekeliruan.
Menerapkan fasa ujian pada pelayan untuk kali pertama dapat memudahkan pelbagai model "kotak hitam" di mana anda membetulkan masalah penyesuaian data. Dalam sesetengah kes, ia menghapuskan proses berlebihan untuk meletakkan pesanan perubahan ke pelbagai platform.
Kemudian, juga, persekitaran pelayan jelas berfungsi dalam proses masa nyata atau dinamik di mana para jurutera akan mahu mengakses pemindahan data dan model kod yang paling sesuai untuk pengeluaran dalam ML. Sebagai contoh, AWS Lambda mungkin merupakan pilihan yang menarik untuk mengendalikan mikrofun pengeluaran (atau kombinasi penyimpanan objek Lambda dan S3) dan tanpa sambungan (tanpa pelayan) yang menjadi mustahil.
Ini adalah beberapa isu pemaju yang mungkin berfikir apabila mereka mempertimbangkan bagaimana untuk memisahkan fasa ML latihan dari ujian dan pengeluaran.