Manajemen jaringan - SageMaker Praktik Terbaik Administrasi Studio

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Manajemen jaringan

Untuk mengatur domain SageMaker AI Studio, Anda perlu menentukan VPC jaringan, subnet, dan grup keamanan. Saat menentukan VPC dan subnet, pastikan Anda mengalokasikan dengan IPs mempertimbangkan volume penggunaan dan pertumbuhan yang diharapkan yang dibahas di bagian berikut.

VPCperencanaan jaringan

VPCSubnet pelanggan yang terkait dengan domain SageMaker AI Studio harus dibuat dengan rentang Classless Inter-domain Routing (CIDR) yang sesuai, tergantung pada faktor-faktor berikut:

  • Jumlah pengguna.

  • Jumlah aplikasi per pengguna.

  • Jumlah jenis instance unik per pengguna.

  • Rata-rata jumlah instans pelatihan per pengguna.

  • Persentase pertumbuhan yang diharapkan.

SageMaker AI dan AWS layanan yang berpartisipasi menyuntikkan antarmuka jaringan elastis (ENI) ke VPC subnet pelanggan untuk kasus penggunaan berikut:

  • Amazon EFS menyuntikkan target EFS pemasangan ENI untuk domain SageMaker AI (satu IP per subnet/Availability Zone yang dilampirkan ke domain AI). SageMaker

  • SageMaker AI Studio menyuntikkan ENI untuk setiap instance unik yang digunakan oleh profil pengguna atau ruang bersama. Sebagai contoh:

    • Jika profil pengguna menjalankan aplikasi server Jupyter default (satu instance 'sistem'), aplikasi Ilmu Data, dan aplikasi Python Dasar (keduanya berjalan pada ml.t3.medium instance), Studio menyuntikkan dua alamat IP.

    • Jika profil pengguna menjalankan aplikasi server Jupyter default (satu instance 'sistem'), aplikasi Tensorflow (pada ml.g4dn.xlarge instance), dan GPU aplikasi data wrangler (pada instance), Studio menyuntikkan tiga ml.m5.4xlarge alamat IP.

  • An ENI untuk setiap VPC titik akhir di seluruh VPC subnet/Availability Zone domain disuntikkan (empat IPs untuk VPC titik akhir SageMaker AI; ~ enam IPs untuk VPC titik akhir layanan yang berpartisipasi seperti S3,, dan.) ECR CloudWatch

  • Jika pekerjaan pelatihan dan pemrosesan SageMaker AI diluncurkan dengan VPC konfigurasi yang sama, setiap pekerjaan membutuhkan dua alamat IP per instance.

catatan

VPCpengaturan untuk SageMaker AI Studio, seperti subnet dan lalu lintas VPC -only, tidak secara otomatis diteruskan ke pekerjaan pelatihan/pemrosesan yang dibuat dari AI Studio. SageMaker Pengguna perlu mengatur VPC pengaturan dan isolasi jaringan seperlunya saat memanggil APIs Create*Job. Lihat Jalankan Pelatihan dan Kontainer Inferensi dalam Mode Bebas Internet untuk informasi lebih lanjut.

Skenario: Ilmuwan data menjalankan eksperimen pada dua jenis instance yang berbeda

Dalam skenario ini, asumsikan domain SageMaker AI diatur dalam mode lalu lintas VPC -only. Ada VPC titik akhir yang disiapkan, seperti SageMaker AI, runtime SageMaker AIAPI, Amazon S3, dan Amazon. ECR

Seorang ilmuwan data menjalankan eksperimen pada notebook Studio, berjalan pada dua jenis instance yang berbeda (misalnya, ml.t3.medium danml.m5.large), dan meluncurkan dua aplikasi di setiap jenis instance.

Asumsikan ilmuwan data juga secara bersamaan menjalankan pekerjaan pelatihan dengan VPC konfigurasi yang sama pada sebuah ml.m5.4xlarge instance.

Untuk skenario ini, layanan SageMaker AI Studio akan menyuntikkan ENIs sebagai berikut:

Tabel 1 — ENIs disuntikkan ke pelanggan VPC untuk skenario eksperimen

Entitas

Target

ENIdisuntikkan

Catatan

Tingkat

EFSpasang target

VPCsubnet

Tiga

AZsTiga/subnet

Domain

Titik akhir VPC

VPCsubnet

30

AZsTiga/subnet dengan masing-masing 10 VPCE

Domain

Server Jupyter

VPCsubnet

Satu

Satu IP per instance

Pengguna

KernelGateway aplikasi

VPCsubnet

Dua

Satu IP per jenis instans

Pengguna

Pelatihan

VPCsubnet

Dua

Dua IPs per contoh pelatihan

Lima IPs per contoh pelatihan jika EFAdigunakan

Pengguna

Untuk skenario ini, ada total 38 yang IPs dikonsumsi di pelanggan di VPC mana 33 IPs dibagikan di seluruh pengguna di tingkat domain, dan lima IPs dikonsumsi di tingkat pengguna. Jika Anda memiliki 100 pengguna dengan profil pengguna serupa di domain ini yang melakukan aktivitas ini secara bersamaan, maka Anda akan mengkonsumsi lima x 100 = 500 IPs di tingkat pengguna, di atas konsumsi IP tingkat domain, yaitu 11 IPs per subnet, dengan total 511. IPs Untuk skenario ini, Anda perlu membuat VPC subnet CIDR dengan/22 yang akan mengalokasikan 1024 alamat IP, dengan ruang untuk tumbuh.

VPCpilihan jaringan

Domain SageMaker AI Studio mendukung konfigurasi VPC jaringan dengan salah satu opsi berikut:

  • Hanya internet publik

  • VPChanya

Opsi khusus internet publik memungkinkan API layanan SageMaker AI untuk menggunakan internet publik melalui gateway internet yang disediakan dalamVPC, dikelola oleh akun layanan SageMaker AI, seperti yang terlihat pada diagram berikut:

Mode default: Akses internet melalui akun layanan SageMaker AI.

Mode default: Akses Internet melalui akun layanan SageMaker AI

VPCSatu-satunya opsi menonaktifkan perutean internet dari yang VPC dikelola oleh akun layanan SageMaker AI, dan memungkinkan pelanggan untuk mengonfigurasi lalu lintas yang akan dirutekan melalui VPC titik akhir, seperti yang terlihat pada diagram berikut:

VPChanya mode: Tidak ada akses internet melalui akun layanan SageMaker AI.

VPCsatu-satunya mode: Tidak ada akses internet melalui akun layanan SageMaker AI

Untuk pengaturan domain VPC hanya dalam mode, siapkan grup keamanan per profil pengguna untuk memastikan isolasi lengkap instance yang mendasarinya. Setiap domain dalam AWS akun dapat memiliki VPC konfigurasi dan mode internetnya sendiri. Untuk detail selengkapnya mengenai pengaturan konfigurasi VPC jaringan, lihat Connect SageMaker AI Studio Notebooks di a VPC to External Resources.

Batasan

  • Setelah domain SageMaker AI Studio dibuat, Anda tidak dapat mengaitkan subnet baru ke domain tersebut.

  • Jenis VPC jaringan (hanya internet publik atau VPChanya) tidak dapat diubah.