Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

Pemecahan Masalah

Mode fokus
Pemecahan Masalah - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Halaman berikut berisi solusi yang diketahui untuk memecahkan masalah kluster HyperPod EKS Anda.

Tab dasbor

Pengaya EKS gagal dipasang

Agar instalasi add-on EKS berhasil, Anda harus memiliki versi Kubernets>= 1.30. Untuk memperbarui, lihat Memperbarui versi Kubernetes.

Agar instalasi add-on EKS berhasil, semua node harus dalam status Ready dan semua pod harus dalam status Running.

Untuk memeriksa status node Anda, gunakan list-cluster-nodes AWS CLI perintah atau navigasikan ke kluster EKS Anda di konsol EKS dan lihat status node Anda. Selesaikan masalah untuk setiap node atau hubungi administrator Anda. Jika status node tidak diketahui, hapus node. Setelah semua status node Siap, coba lagi instal add-on EKS HyperPod dari konsol Amazon SageMaker AI.

Untuk memeriksa status pod Anda, gunakan kubectl get pods -n cloudwatch-agent perintah CLI Kubernetes atau navigasikan ke klaster EKS Anda di konsol EKS dan lihat status pod Anda dengan namespace. cloudwatch-agent Selesaikan masalah Pod atau hubungi administrator Anda untuk menyelesaikan masalah. Setelah semua status pod Berjalan, coba lagi instal add-on EKS HyperPod dari konsol Amazon SageMaker AI.

Untuk pemecahan masalah lainnya, lihat Memecahkan masalah add-on CloudWatch Amazon Observability EKS.

Tab Tugas

Jika Anda melihat pesan galat tentang bagaimana Definisi Sumber Daya Kustom (CRD) tidak dikonfigurasi di klaster, berikan EKSAdminViewPolicy dan ClusterAccessRole kebijakan untuk peran eksekusi domain Anda.

Kebijakan

Berikut ini mencantumkan solusi untuk kesalahan yang berkaitan dengan kebijakan yang menggunakan HyperPod APIs atau konsol.

  • Jika kebijakan dalam CreateFailed atau CreateRollbackFailed status, Anda perlu menghapus kebijakan yang gagal dan membuat yang baru.

  • Jika kebijakan dalam UpdateFailed status, coba lagi pembaruan dengan kebijakan yang sama ARN.

  • Jika kebijakan dalam UpdateRollbackFailed status, Anda perlu menghapus kebijakan yang gagal dan kemudian membuat yang baru.

  • Jika kebijakan dalam DeleteFailed atau DeleteRollbackFailed status, coba lagi penghapusan dengan kebijakan yang sama ARN.

    • Jika Anda mengalami kesalahan saat mencoba menghapus prioritas Komputasi, atau kebijakan klaster, menggunakan HyperPod konsol, coba hapus cluster-scheduler-config penggunaan API. Untuk memeriksa status sumber daya, buka halaman detail alokasi komputasi.

Untuk melihat detail lebih lanjut tentang kegagalan, gunakan API describe.

PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.