Merencanakan sukacara - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Merencanakan sukacara

Bruno Klein, Amazon Web Services (AWS)

Desember 2021 (riwayat dokumen)

Menerapkan solusi machine learning (ML) dalam produksi memperkenalkan banyak tantangan yang tidak muncul dalam proyek pengembangan perangkat lunak standar. Solusi ML lebih kompleks dan lebih sulit untuk mendapatkan yang tepat di tempat pertama. Mereka juga ada di lingkungan yang biasanya tidak stabil, di mana distribusi data menyimpang secara signifikan dari waktu ke waktu karena berbagai alasan yang diharapkan dan tidak terduga.

Masalah-masalah ini semakin diperparah oleh fakta bahwa banyak praktisi ML tidak berasal dari latar belakang rekayasa perangkat lunak, jadi mereka mungkin tidak terbiasa dengan praktik terbaik industri ini, seperti menulis kode yang dapat diuji, komponen modularisasi, dan menggunakan kontrol versi secara efektif. Tantangan-tantangan ini menciptakan utang teknis, dan solusi menjadi lebih kompleks dan sulit dipertahankan seiring waktu, didukung oleh efek peracikan, bagi tim ML.

Panduan ini menyebutkan praktik terbaik operasi ML (MLOP) yang membantu mengurangi tantangan ini dalam proyek dan beban kerja ML.

Karena mLOP adalah masalah lintas sektor, masalah ini tidak hanya mempengaruhi proses penyebaran dan pemantauan, tetapi juga seluruh siklus hidup model. Dalam panduan ini, praktik terbaik mLOP disusun dalam empat bidang utama:

Hasil bisnis yang ditargetkan

Menerapkan model ML dalam produksi adalah tugas yang membutuhkan upaya terus-menerus dan tim yang berdedikasi untuk mempertahankan sumber daya ini sepanjang masa pakainya (dalam beberapa kasus, bahkan bertahun-tahun). Model MLdapat membuka nilai yang cukup besar dari data bisnis, tetapi mereka memiliki biaya tinggi. Untuk meminimalkan biaya, perusahaan harus mengikuti praktik yang baik dalam pengembangan perangkat lunak dan ilmu data. Mereka harus menyadari nuansa sistem ML, seperti data drift, yang membuat model tampil tak terduga setelah beberapa saat. Dengan menyadari kekhawatiran ini, perusahaan dapat memenuhi tujuan bisnis mereka dengan aman dan dengan kelincahan dalam jangka pendek dan jangka panjang.

Ada beberapa jenis model ML, dan industri yang mereka targetkan memiliki berbagai jenis tugas dan masalah bisnis, jadi Anda perlu mempertimbangkan serangkaian masalah yang berbeda untuk setiap model dan industri. Praktik yang ditetapkan dalam panduan ini tidak spesifik untuk model atau bisnis, tetapi berlaku untuk serangkaian model dan industri yang luas untuk meningkatkan waktu penyebaran, menghasilkan produktivitas yang lebih tinggi, dan membangun tata kelola dan keamanan yang lebih kuat.

Menempatkan model ke dalam produksi adalah tugas multi-disiplin yang membutuhkan ilmuwan data, insinyur pembelajaran mesin, insinyur data, dan insinyur perangkat lunak. Saat Anda membangun tim ML, kami sarankan Anda menargetkan keterampilan dan latar belakang ini.