Pantau sumber daya SageMaker HyperPod cluster - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pantau sumber daya SageMaker HyperPod cluster

Untuk mencapai observabilitas komprehensif ke dalam sumber daya SageMaker HyperPod klaster dan komponen perangkat lunak Anda, integrasikan cluster dengan Amazon Managed Service for Prometheus dan Amazon Managed Grafana. Integrasi dengan Amazon Managed Service untuk Prometheus memungkinkan ekspor metrik yang terkait dengan sumber daya klaster HyperPod Anda, memberikan wawasan tentang kinerja, pemanfaatan, dan kesehatannya. Integrasi dengan Amazon Managed Grafana memungkinkan visualisasi metrik ini melalui berbagai dasbor Grafana yang menawarkan antarmuka intuitif untuk memantau dan menganalisis perilaku cluster. Dengan memanfaatkan layanan ini, Anda mendapatkan tampilan HyperPod klaster yang terpusat dan terpadu, memfasilitasi pemantauan proaktif, pemecahan masalah, dan optimalisasi beban kerja pelatihan terdistribusi Anda.

Tip

Untuk menemukan contoh dan solusi praktis, lihat juga SageMaker HyperPodlokakarya.

Ikhtisar konfigurasi SageMaker HyperPod dengan Amazon Managed Service untuk Prometheus dan Amazon Managed Grafana.

Gambar: Diagram arsitektur ini menunjukkan ikhtisar konfigurasi SageMaker HyperPod dengan Amazon Managed Service untuk Prometheus dan Amazon Managed Grafana.

Lanjutkan ke topik berikut untuk menyiapkan observabilitas SageMaker HyperPod cluster.