As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Os tópicos a seguir abordam o registro e o gerenciamento de SageMaker HyperPod clusters.
Registrando SageMaker HyperPod eventos
Todos os eventos e registros de SageMaker HyperPod são salvos na Amazon CloudWatch com o nome do grupo de registros/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]
. Cada chamada para a API CreateCluster
cria um novo grupo de logs. A lista a seguir contém todos os fluxos de logs disponíveis coletados em cada grupo de logs.
Nome do grupo de logs | Nome do fluxo de logs |
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] |
LifecycleConfig/[instance-group-name]/[instance-id] |
Registro SageMaker HyperPod em nível de instância
Você pode acessar os LifecycleScript registros publicados CloudWatch durante a configuração da instância do cluster. Cada instância dentro do cluster criado gera um fluxo de log separado, que pode ser distinguido pelo formato LifecycleConfig/[instance-group-name]/[instance-id]
.
Todos os registros gravados /var/log/provision/provisioning.log
são enviados para o CloudWatch stream anterior. Amostra LifecycleScripts ao 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-config
stdout
e stderr
para este local. Se você estiver usando seus scripts personalizados, grave seus registros no /var/log/provision/provisioning.log
local em que eles estejam disponíveis CloudWatch.
Marcar recursos
AWS O sistema de marcação ajuda a gerenciar, identificar, organizar, pesquisar e filtrar recursos. SageMaker HyperPod oferece suporte à marcação, para que você possa gerenciar os clusters como um AWS recurso. Durante a criação do cluster ou a edição de um cluster existente, você pode adicionar ou editar marcações para o cluster. Para saber mais sobre a marcação em geral, consulte Como marcar seus AWS recursos.
Usando a interface do usuário SageMaker HyperPod do console
Quando você está criando um novo cluster ou editando um cluster, pode adicionar, remover ou editar marcações.
Usando o SageMaker HyperPod APIs
Ao escrever um arquivo de solicitação de UpdateClusterAPI CreateClusterou de uma API no formato JSON, edite a Tags
seção.
Usando os comandos de AWS CLI marcação para IA SageMaker
Para marcar um cluster
Use aws sagemaker add-tags
da seguinte forma:
aws sagemaker add-tags --resource-arn
cluster_ARN
--tags Key=string
,Value=string
Para desmarcar um cluster
Use aws sagemaker delete-tags
da seguinte forma:
aws sagemaker delete-tags --resource-arn
cluster_ARN
--tag-keys"tag_key"
Para listar as marcações para um recurso
Use aws sagemaker list-tags
da seguinte forma:
aws sagemaker list-tags --resource-arn
cluster_ARN