Atualizar endpoints que usam o ajuste de escala automático - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Atualizar endpoints que usam o ajuste de escala automático

Quando você atualiza um endpoint, o Application Auto Scaling verifica se algum dos modelos nesse endpoint são destinos do ajuste de escala automático. Se a atualização alterar o tipo de instância de qualquer modelo que esteja submetido ao ajuste de escala automático, o procedimento falhará.

No AWS Management Console, você vê um aviso de que é necessário cancelar o registro do modelo do escalonamento automático antes de poder atualizá-lo. Se você estiver tentando atualizar o endpoint chamando a API UpdateEndpoint, a chamada falhará. Antes de atualizar o endpoint, exclua todas as políticas de escalabilidade configuradas para ele e cancele o registro da variante como um destino escalável chamando a ação da API Application Auto Scaling DeregisterScalableTarget. Depois de atualizar o endpoint, você pode registrar a variante atualizada como um destino escalável e anexar uma política de ajuste de escala.

Há uma exceção. Se você alterar o modelo de uma variante configurada para escalonamento automático, o Amazon SageMaker AI Auto Scaling permitirá a atualização. Isso porque a alteração do modelo normalmente não afeta o desempenho a ponto de alterar o comportamento de ajuste de escala. Se você atualizar um modelo de uma variante configurada para o ajuste de escala automático, a alteração do modelo não poderá afetar significativamente o desempenho e o comportamento do ajuste de escala.

Ao atualizar os endpoints de SageMaker IA que têm o escalonamento automático aplicado, conclua as seguintes etapas:

Como atualizar um endpoint que possui o ajuste de escala automático aplicado
  1. Cancele o registro do endpoint como um alvo escalável ligando para. DeregisterScalableTarget

  2. Devido ao ajuste de escala automático ser bloqueado durante a operação de atualização em andamento (ou caso você tenha desativado o ajuste de escala automático na etapa anterior), convém tomar a precaução adicional de aumentar o número de instâncias de seu endpoint durante a atualização. Para fazer isso, atualize as contagens de instâncias para as variantes de produção hospedadas no endpoint, chamando UpdateEndpointWeightsAndCapacities.

  3. Chame DescribeEndpoint repetidamente até que o valor no campo EndpointStatus da resposta seja InService.

  4. Chame DescribeEndpointConfig para obter os valores da configuração do endpoint atual.

  5. Crie uma configuração de endpoint chamando CreateEndpointConfig. Para as variantes de produção nas quais você deseja manter a contagem ou peso de instâncias existentes, use o mesmo nome de variante da resposta da chamada para DescribeEndpointConfig na etapa anterior. Para todos os outros valores, use os valores que você obteve como resposta ao chamar DescribeEndpointConfig na etapa anterior.

  6. Atualize o endpoint chamando UpdateEndpoint. Especifique a configuração do endpoint criado na etapa anterior no campo EndpointConfig. Se você quiser reter as propriedades da variante, como contagem de instâncias ou peso, defina o valor do parâmetro RetainAllVariantProperties como True. Isso especifica que as variantes de produção com o mesmo nome serão atualizadas com a DesiredInstanceCount mais recente da resposta da chamada para DescribeEndpoint, independentemente dos valores do campo InitialInstanceCount no novo EndpointConfig.

  7. (Opcional) Reative o escalonamento automático ligando para e. RegisterScalableTargetPutScalingPolicy

nota

As etapas 1 e 7 são necessárias somente se você estiver atualizando um endpoint com as seguintes alterações:

  • Alteração do tipo de instância de uma variante de produção da qual foi configurado o ajuste de escala automático

  • Remoção de uma variante de produção que tem o ajuste de escala automático configurado.