Q:
Apa yang lebih baik, platform atau algoritma pembelajaran mesin membawa-diri sendiri pada AWS?
A:Hari ini, banyak syarikat mengintegrasikan penyelesaian pembelajaran mesin ke dalam alat analisis mereka yang ditetapkan untuk meningkatkan pengurusan jenama, meningkatkan pengalaman pelanggan dan meningkatkan kecekapan operasi. Model pembelajaran mesin adalah komponen utama penyelesaian pembelajaran mesin. Model dilatih menggunakan algoritma matematik dan set data besar untuk membuat ramalan yang boleh dipercayai. Contoh umum ramalan adalah (1) menentukan sama ada satu set transaksi kewangan menunjukkan penipuan atau (2) menilai sentimen pengguna di sekitar produk, berdasarkan input yang dikumpulkan dari media sosial.
Amazon SageMaker adalah perkhidmatan terurus sepenuhnya yang membolehkan para saintis pemaju dan data membina, melatih dan menggunakan model pembelajaran mesin. Dalam SageMaker, anda boleh menggunakan algoritma luar kotak atau pergi laluan membawa-sendiri untuk penyelesaian yang lebih khusus. Kedua-dua pilihan sah dan berfungsi sama rata sebagai asas untuk penyelesaian pembelajaran mesin yang berjaya.
(Nota editor: Anda boleh melihat alternatif lain untuk SageMaker di sini.)
Algoritma out-of-the-box SageMaker termasuk contoh yang popular, sangat dioptimumkan untuk klasifikasi imej, pemprosesan bahasa semula jadi, dan lain-lain. Senarai lengkap boleh didapati di sini .
- Kelebihan Out-of-the-Box: Algoritma ini telah dioptimumkan terlebih dahulu (dan sedang mengalami peningkatan berterusan). Anda boleh berdiri, berjalan dan cepat digunakan. Plus, penalaan parameter hyper-parameter AWS tersedia.
- Pertimbangan di luar kotak: Penambahbaikan yang berterusan yang dinyatakan di atas mungkin tidak menghasilkan keputusan sebagaimana diramalkan seolah-olah anda mempunyai kawalan sepenuhnya terhadap pelaksanaan algoritma anda.
Jika algoritma ini tidak sesuai untuk projek anda, anda mempunyai tiga pilihan lain: (1) Perpustakaan Apache Spark Amazon, (2) kod Python tersuai (yang menggunakan TensorFLow atau Apache MXNet) atau (3) "bawa sendiri" di mana anda pada asasnya tidak terkawal, tetapi perlu membuat imej Docker untuk melatih dan memberi servis kepada model anda (anda boleh berbuat demikian menggunakan arahan di sini ).
Pendekatan yang membawa anda sendiri menawarkan kebebasan lengkap. Ini mungkin terbukti menarik kepada para saintis data yang telah membina perpustakaan kod algoritma adat dan / atau proprietari yang mungkin tidak diwakili dalam set peti keluar semasa.
- Bawa Keuntungan Sendiri: Membolehkan kawalan lengkap ke keseluruhan saluran sains sains data bersama dengan penggunaan IP proprietari.
- Pertimbangan Bawa-Sendiri: Pengunduran diperlukan untuk melatih dan menyampaikan model yang dihasilkan. Menggabungkan peningkatan algoritma adalah tanggungjawab anda.
Terlepas dari pilihan algoritma anda, SageMaker pada AWS adalah pendekatan yang patut dipertimbangkan, memandangkan betapa banyak tumpuan telah diletakkan pada kemudahan penggunaan dari perspektif sains data. Jika anda pernah cuba untuk memindahkan projek pembelajaran mesin dari persekitaran setempat anda kepada yang dihoskan, anda akan terkejut melihat bagaimana SageMaker lancar menjadikannya. Dan jika anda bermula dari awal, anda sudah beberapa langkah lebih dekat dengan matlamat anda, memandangkan berapa banyak sudah berada di hujung jari anda.