Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Executar trabalhos de treinamento em um cluster heterogêneo

Modo de foco
Executar trabalhos de treinamento em um cluster heterogêneo - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usando o recurso de cluster heterogêneo do SageMaker Training, você pode executar um trabalho de treinamento com vários tipos de instâncias de ML para uma melhor escalabilidade e utilização de recursos para diferentes tarefas e propósitos de treinamento de ML. Por exemplo, se o seu trabalho de treinamento em um cluster com instâncias de GPU apresentar problemas de baixa utilização da GPU e de gargalo de CPU devido a tarefas intensivas de CPU, o uso de um cluster heterogêneo pode ajudar a aliviar tarefas intensivas de CPU adicionando grupos de instâncias de CPU mais econômicos, resolvendo esses problemas de gargalo e alcançando uma melhor utilização da GPU.

nota

Esse recurso está disponível no SageMaker Python SDK v2.98.0 e versões posteriores.

nota

Esse recurso está disponível por meio das classes de estimadores de TensorFlowestrutura PyTorche SageMaker IA. As estruturas suportadas são PyTorch v1.10 ou posterior e TensorFlow v2.6 ou posterior.

Veja também o blog Melhore a relação preço/desempenho de seu treinamento de modelos usando clusters heterogêneos de SageMaker IA da Amazon.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.