Kelola perangkat EFA di Amazon EKS - Amazon EKS

Bantu tingkatkan halaman ini

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Untuk berkontribusi pada panduan pengguna ini, pilih Edit halaman ini pada GitHub tautan yang terletak di panel kanan setiap halaman.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kelola perangkat EFA di Amazon EKS

Elastic Fabric Adapter (EFA) adalah perangkat jaringan untuk instans Amazon EC2 yang memungkinkan komunikasi antar simpul berkinerja tinggi untuk pelatihan pembelajaran mesin dan beban kerja Komputasi Kinerja Tinggi (HPC). Amazon EKS mendukung plugin perangkat EFA untuk mengelola perangkat EFA di kluster EKS.

Membuat node EKS dengan antarmuka EFA

Saat Anda membuat node EKS dengan antarmuka EFA, antarmuka EFA dilampirkan selama bootstrap instance. Jika Anda perlu menyesuaikan konfigurasi EFA per perangkat atau menggunakan grup penempatan untuk instans EC2 berkemampuan EFA, disarankan untuk menggunakan grup simpul terkelola EKS atau grup simpul yang dikelola sendiri EKS. Anda dapat meneruskan konfigurasi untuk setiap antarmuka jaringan dengan template peluncuran.

Saat menggunakan EKS Auto Mode atau Karpenter dengan penyediaan dinamis, instance yang dibuat untuk permintaan Pod vpc.amazonaws.com/efa memiliki semua antarmuka yang dikonfigurasi dengan tipe antarmuka. EFA Penyediaan kapasitas statis dalam Mode Otomatis EKS dan Karpenter saat ini tidak mendukung konfigurasi EFA per perangkat. Mode Otomatis EKS dan Karpenter saat ini tidak mendukung grup penempatan.

Saat menggunakan eksctluntuk menyediakan node EKS dengan efaEnabled pengaturan, semua antarmuka dikonfigurasi dengan tipe antarmukaEFA, grup keamanan khusus EFA dibuat, dan plugin perangkat EFA diinstal pada cluster. Jika Anda perlu menyesuaikan konfigurasi EFA per perangkat saat menggunakaneksctl, disarankan untuk menggunakan dukungan `eksctl untuk templat peluncuran.

Menggunakan EKS-dioptimalkan AMIs dengan EFA

AL2023 Akselerasi yang dioptimalkan EKS AMIs (NVIDIA dan Neuron) dan semua Bottlerocket AMIs menyertakan komponen tingkat host yang diperlukan untuk menggunakan EFA. EKS AL2023 dan Bottlerocket AMIs tidak menyertakan plugin perangkat EFA, dan plugin perangkat harus diinstal secara terpisah di cluster Anda sebelum menerapkan beban kerja yang menggunakan EFA.

Instal plugin perangkat EFA Kubernetes

Plugin perangkat EFA mengiklankan perangkat EFA sebagai vpc.amazonaws.com/efa sumber daya yang diperluas. Anda meminta perangkat EFA dalam permintaan dan batasan sumber daya kontainer. Untuk panduan lengkap tentang pengaturan EFA dengan beban kerja pelatihan, lihat. Jalankan pelatihan pembelajaran mesin di Amazon EKS dengan Adaptor Kain Elastis

Plugin perangkat EFA secara otomatis mengalokasikan perangkat EFA yang secara topologi dekat dengan akselerator Neuron dan GPU NVIDIA pada instans EC2 fisik.

Prasyarat

  • Cluster Amazon EKS.

  • Node dengan tipe instans Amazon EC2 berkemampuan EFA. Untuk daftar jenis instans yang didukung, lihat Jenis instans yang didukung di Panduan Pengguna Amazon EC2.

  • Node dengan komponen tingkat host dipasang untuk EFA. Ini termasuk jika menggunakan AL2023 AKSELERASI EKS AMIs atau EKS AMIs Bottlerocket.

  • Helm diinstal di lingkungan baris perintah Anda, lihat petunjuk Setup Helm untuk informasi selengkapnya.

  • kubectldikonfigurasi untuk berkomunikasi dengan cluster Anda, lihat Instal atau perbarui kubectl untuk informasi selengkapnya.

Prosedur

  1. Tambahkan repositori bagan EKS Helm.

    helm repo add eks https://aws.github.io/eks-charts
  2. Perbarui repositori Helm lokal Anda.

    helm repo update
  3. Instal plugin perangkat EFA.

    helm install efa eks/aws-efa-k8s-device-plugin -n kube-system
  4. Verifikasi plugin perangkat EFA DaemonSet sedang berjalan.

    kubectl get daemonset -n kube-system aws-efa-k8s-device-plugin-daemonset
    NAME DESIRED CURRENT READY UP-TO-DATE AVAILABLE NODE SELECTOR AGE aws-efa-k8s-device-plugin-daemonset 2 2 2 2 2 <none> 60s
  5. Verifikasi bahwa node Anda memiliki sumber daya EFA yang dapat dialokasikan.

    kubectl get nodes "-o=custom-columns=NAME:.metadata.name,EFA:.status.allocatable.vpc\.amazonaws\.com/efa"
    NAME EFA ip-192-168-11-225.us-west-2.compute.internal 4 ip-192-168-24-96.us-west-2.compute.internal 4

Meminta perangkat EFA di Pod

Untuk meminta perangkat EFA menggunakan plugin perangkat, tentukan vpc.amazonaws.com/efa sumber daya dalam permintaan atau batasan sumber daya penampung Anda.

apiVersion: v1 kind: Pod metadata: name: efa-workload spec: containers: - name: app ... resources: limits: vpc.amazonaws.com/efa: 4 hugepages-2Mi: ... requests: vpc.amazonaws.com/efa: 4 hugepages-2Mi: ...