Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Buat image container Docker kustom untuk SageMaker dan gunakan untuk pelatihan model di AWS Step Functions
Julia Bluszcz, Aubrey Oosthuizen, Mohan Gowda Purushothama, Neha Sharma, dan Mateusz Zaremba, Amazon Web Services
Ringkasan
Pola ini menunjukkan cara membuat image container Docker untuk Amazon SageMaker dan menggunakannya untuk model pelatihan di AWS Step Functions. Dengan mengemas algoritme kustom dalam wadah, Anda dapat menjalankan hampir semua kode di SageMaker lingkungan, terlepas dari bahasa pemrograman, kerangka kerja, atau dependensi.
Dalam contoh SageMaker notebook yang disediakan, image container Docker kustom disimpan di Amazon Elastic Container Registry (Amazon ECR) Registry ECR). Step Functions kemudian menggunakan wadah yang disimpan di Amazon ECR untuk menjalankan skrip pemrosesan Python. SageMaker Kemudian, wadah mengekspor model ke Amazon Simple Storage Service (Amazon S3).
Prasyarat dan batasan
Prasyarat
Akun AWS yang aktif
Peran AWS Identity and Access Management (IAM) SageMaker dengan izin Amazon S3
Peran IAM untuk Step
Functions Keakraban dengan Python
Keakraban dengan Amazon SageMaker Python SDK
Keakraban dengan AWS Command Line Interface (AWS CLI)
Keakraban dengan AWS SDK for Python (Boto3)
Keakraban dengan Amazon ECR
Keakraban dengan Docker
Versi produk
AWS Step Functions Data Science SDK versi 2.3.0
Amazon SageMaker Python SDK versi 2.78.0
Arsitektur
Diagram berikut menunjukkan contoh alur kerja untuk membuat image container Docker untuk SageMaker, kemudian menggunakannya untuk model pelatihan di Step Functions:

Diagram menunjukkan alur kerja berikut:
Seorang ilmuwan atau DevOps insinyur data menggunakan SageMaker notebook Amazon untuk membuat gambar kontainer Docker kustom.
Seorang ilmuwan atau DevOps insinyur data menyimpan gambar kontainer Docker di repositori pribadi Amazon ECR yang ada di registri pribadi.
Seorang ilmuwan atau DevOps insinyur data menggunakan wadah Docker untuk menjalankan pekerjaan pemrosesan SageMaker Python dalam alur kerja Step Functions.
Otomatisasi dan skala
Contoh SageMaker notebook dalam pola ini menggunakan jenis instance ml.m5.xlarge
notebook. Anda dapat mengubah jenis instance agar sesuai dengan kasus penggunaan Anda. Untuk informasi selengkapnya tentang jenis instans SageMaker notebook, lihat SageMaker Harga Amazon
Alat
Amazon Elastic Container Registry (Amazon ECR) adalah layanan registri gambar kontainer terkelola yang aman, terukur, dan andal.
Amazon SageMaker adalah layanan pembelajaran mesin terkelola (ML) yang membantu Anda membuat dan melatih model ML, lalu menerapkannya ke lingkungan host yang siap produksi.
Amazon SageMaker Python SDK
adalah pustaka sumber terbuka untuk melatih dan menerapkan model pembelajaran mesin. SageMaker AWS Step Functions adalah layanan orkestrasi tanpa server yang membantu Anda menggabungkan fungsi AWS Lambda dan layanan AWS lainnya untuk membangun aplikasi yang penting bagi bisnis.
AWS Step Functions Data Science Python SDK
adalah pustaka open source yang membantu Anda membuat alur kerja Step Functions yang memproses dan menerbitkan model pembelajaran mesin.
Epik
Tugas | Deskripsi | Keterampilan yang dibutuhkan |
---|---|---|
Siapkan Amazon ECR dan buat registri pribadi baru. | Jika Anda belum melakukannya, siapkan Amazon ECR dengan mengikuti petunjuk dalam Menyiapkan dengan Amazon ECR di Panduan Pengguna Amazon ECR. Setiap akun AWS dilengkapi dengan registri ECR Amazon pribadi default. | DevOps insinyur |
Buat repositori pribadi Amazon ECR. | Ikuti petunjuk dalam Membuat repositori pribadi di Panduan Pengguna Amazon ECR. catatanRepositori yang Anda buat adalah tempat Anda akan menyimpan gambar kontainer Docker kustom Anda. | DevOps insinyur |
Buat Dockerfile yang menyertakan spesifikasi yang diperlukan untuk menjalankan pekerjaan SageMaker pemrosesan Anda. | Buat Dockerfile yang menyertakan spesifikasi yang diperlukan untuk menjalankan pekerjaan SageMaker pemrosesan Anda dengan mengonfigurasi Dockerfile. Untuk petunjuknya, lihat Mengadaptasi wadah pelatihan Anda sendiri di Panduan SageMaker Pengembang Amazon. Untuk informasi selengkapnya tentang Dockerfiles, lihat Referensi Dockerfile Contoh sel kode notebook Jupyter untuk membuat Dockerfile Sel 1
Sel 2
| DevOps insinyur |
Buat gambar kontainer Docker Anda dan dorong ke Amazon ECR. |
Untuk informasi selengkapnya, lihat Membangun dan mendaftarkan kontainer Contoh sel kode notebook Jupyter untuk membangun dan mendaftarkan gambar Docker pentingSebelum menjalankan sel berikut, pastikan Anda telah membuat Dockerfile dan menyimpannya di direktori yang disebut. Sel 1
Sel 2
Sel 3
Sel 4
catatanAnda harus mengautentikasi klien Docker Anda ke registri pribadi Anda sehingga Anda dapat menggunakan perintah | DevOps insinyur |
Tugas | Deskripsi | Keterampilan yang dibutuhkan |
---|---|---|
Buat skrip Python yang mencakup pemrosesan kustom dan logika pelatihan model Anda. | Tulis logika pemrosesan khusus untuk dijalankan dalam skrip pemrosesan data Anda. Kemudian, simpan sebagai skrip Python bernama. Untuk informasi selengkapnya, lihat Membawa model Anda sendiri dengan Mode SageMaker Skrip aktif Contoh skrip Python yang mencakup pemrosesan kustom dan logika pelatihan model
| Ilmuwan data |
Buat alur kerja Step Functions yang menyertakan pekerjaan SageMaker Processing Anda sebagai salah satu langkahnya. | Instal dan impor AWS Step Functions Data Science SDK pentingPastikan Anda telah membuat peran eksekusi IAM untuk Step Functions Contoh pengaturan lingkungan dan skrip pelatihan khusus untuk diunggah ke Amazon S3
Contoh definisi langkah SageMaker pemrosesan yang menggunakan gambar Amazon ECR kustom dan skrip Python catatanPastikan Anda menggunakan
Contoh alur kerja Step Functions yang menjalankan pekerjaan SageMaker pemrosesan catatanContoh alur kerja ini mencakup langkah pekerjaan SageMaker pemrosesan saja, bukan alur kerja Step Functions yang lengkap. Untuk contoh alur kerja lengkap, lihat Contoh notebook SageMaker dalam
| Ilmuwan data |
Sumber daya terkait
Memproses data (Panduan SageMaker Pengembang Amazon)
Mengadaptasi wadah pelatihan Anda sendiri (Panduan SageMaker Pengembang Amazon)