SageMaker HyperPod gestione dei cluster - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker HyperPod gestione dei cluster

Negli argomenti seguenti vengono illustrate la registrazione e la gestione dei cluster. SageMaker HyperPod

Registrazione degli eventi SageMaker HyperPod

Tutti gli eventi e i log di SageMaker HyperPod vengono salvati su Amazon CloudWatch con il nome /aws/sagemaker/Clusters/[ClusterName]/[ClusterID] del gruppo di log. Ogni chiamata all'CreateClusterAPI crea un nuovo gruppo di log. L'elenco seguente contiene tutti i flussi di log disponibili raccolti in ogni gruppo di log.

Nome del gruppo di log Nome del flusso di registro
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

Registrazione SageMaker HyperPod a livello di istanza

È possibile accedere ai LifecycleScript log pubblicati CloudWatch durante la configurazione dell'istanza del cluster. Ogni istanza all'interno del cluster creato genera un flusso di log separato, distinguibile in base al formato. LifecycleConfig/[instance-group-name]/[instance-id]

Tutti i log in cui vengono scritti /var/log/provision/provisioning.log vengono caricati nel flusso precedente. CloudWatch Sample LifecycleScripts at 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configreindirizza il loro terreno stderr verso stdout questa posizione. Se utilizzi script personalizzati, scrivi i log nella /var/log/provision/provisioning.log posizione in cui saranno disponibili. CloudWatch

Assegnazione di tag alle risorse

AWS Il sistema di tagging aiuta a gestire, identificare, organizzare, cercare e filtrare le risorse. SageMaker HyperPod supporta l'etichettatura, in modo da poter gestire i cluster come risorsa. AWS Durante la creazione del cluster o la modifica di un cluster esistente, è possibile aggiungere o modificare i tag per il cluster. Per ulteriori informazioni sull'etichettatura in generale, consulta Taggare le AWS risorse.

Utilizzo dell'interfaccia utente della console SageMaker HyperPod

Quando crei un nuovo cluster e ne modifichi uno, puoi aggiungere, rimuovere o modificare tag.

Utilizzo delle SageMaker HyperPod API

Quando scrivi un file di richiesta CreateClustero UpdateClusterAPI in formato JSON, modifica la Tags sezione.

Utilizzo dei comandi di AWS CLI tagging per SageMaker

Per etichettare un cluster

Usa aws sagemaker add-tagscome segue.

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

Per rimuovere i tag da un cluster

Usa aws sagemaker delete-tagscome segue.

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

Per elencare i tag di una risorsa

Usa aws sagemaker list-tagscome segue.

aws sagemaker list-tags --resource-arn cluster_ARN