Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Osservabilità dei cluster
Per ottenere visibilità sull'utilizzo delle risorse del cluster, configura Amazon CloudWatch Container Insights e Amazon Managed Grafana per estrarre i parametri e visualizzarli su vari dashboard.
Amazon CloudWatch Container Insights
Usa Amazon CloudWatch Container Insights per raccogliere, aggregare e riepilogare metriche e log dalle applicazioni containerizzate e dai microservizi sul cluster EKS associato a un cluster. HyperPod
Amazon CloudWatch Insights raccoglie parametri per le risorse di calcolo, come CPU, memoria, disco e rete. Container Insights fornisce inoltre informazioni diagnostiche, ad esempio errori di riavvio del container, che consentono di isolare i problemi e risolverli in modo rapido. Puoi anche impostare CloudWatch allarmi sui parametri raccolti da Container Insights.
Per trovare un elenco completo delle metriche, consulta le metriche di Amazon EKS e Kubernetes Container Insights nella Guida per l'utente di Amazon EKS.
CloudWatch Installa Container Insights
Gli utenti amministratori del cluster devono configurare CloudWatch Container Insights seguendo le istruzioni in Installa l' CloudWatch agente utilizzando il componente aggiuntivo Amazon CloudWatch Observability EKS o il grafico Helm nella Guida per l'CloudWatch utente. Per ulteriori informazioni sul componente aggiuntivo Amazon EKS, consulta anche Installa il componente aggiuntivo Amazon CloudWatch Observability EKS nella Guida per l'utente di Amazon EKS.
Una volta completata l'installazione, verifica che il componente aggiuntivo CloudWatch Observability sia visibile nella scheda del componente aggiuntivo del cluster EKS. Il caricamento del dashboard potrebbe richiedere circa un paio di minuti.
Nota
SageMaker HyperPod richiede CloudWatch Insight v2.0.1-eksbuild.1 o successivo.

Accedi CloudWatch alla dashboard di Container Insights
Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/
. -
Scegli Insights, quindi scegli Container Insights.
-
Seleziona il cluster EKS configurato con il HyperPod cluster che stai utilizzando.
-
Visualizza le metriche a livello di Pod/Cluster.

Accedi ai log CloudWatch di Container Insights
Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/
. -
Scegli Log e quindi Gruppi di log.
Quando HyperPod i cluster sono integrati con Amazon CloudWatch Container Insights, puoi accedere ai gruppi di log pertinenti nel seguente formato:/aws/containerinsights /<eks-cluster-name>/*
. All'interno di questo gruppo di log, puoi trovare ed esplorare vari tipi di log come i log delle prestazioni, i log degli host, i log delle applicazioni e i log del piano dati.
Configura uno spazio di lavoro Amazon Managed Grafana
Puoi integrarti SageMaker HyperPod con Amazon Managed Grafana e Amazon Managed Service for Prometheus per ottenere un'osservabilità completa del cluster e visualizzarlo in varie dashboard Grafana: la dashboard di monitoraggio del cluster Kubernetes, la dashboard di esportazione NVIDIA DCGM, la dashboard delle metriche for Lustre e la dashboard delle metriche EFA. FSx