Escalabilidade programada - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Escalabilidade programada

Com a escalabilidade programada, você pode ajustar o provisionamento de endpoints para atender às suas necessidades de capacidade em um cronograma específico. A escalabilidade programada ajusta automaticamente o número de unidades de inferência para acomodar picos de uso em horários específicos. Você pode usar a escalabilidade programada para endpoints de classificação de documentos e endpoints de reconhecimento de entidades. Para mais informações sobre escalabilidade programada, consulte Escalabilidade programada para Ajuste de escala automático do aplicativo.

nota

Os exemplos a seguir estão formatados para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).

Configurando a escalabilidade programada

Para configurar a escalabilidade programada para um endpoint, você usa comandos da CLI AWS para registrar um destino escalável e, em seguida, criar uma ação programada. O destino escalável define as unidades de inferência como o recurso usado para ajustar o provisionamento de endpoints e a ação programada controla o ajuste de escala automático da capacidade provisionada em horários específicos.

Para configurar a escalabilidade programada
  1. Registrar um destino escalável. Os exemplos a seguir registram um destino escalável para ajustar o provisionamento de endpoints com uma capacidade mínima de 1 unidade de inferência e uma capacidade máxima de 2 unidades de inferência.

    Para obter um documento de classificação de endpoint, use o comando AWS a seguir:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Para um endpoint reconhecedor de entidades, use o seguinte comando da CLI AWS:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Criar uma ação programada. Os exemplos a seguir criam uma ação programada para ajustar automaticamente a capacidade provisionada todos os dias às 12:00 UTC com um mínimo de 2 unidades de inferência e um máximo de 5 unidades de inferência. Para obter mais informações sobre expressões cronológicas e escalabilidade programada, consulte Expressões de programação.

    Para obter um documento de classificação de endpoint, use o comando AWS a seguir:

    aws application-autoscaling put-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction \ --schedule "cron(0 12 * * ? *)" \ --scalable-target-action MinCapacity=2,MaxCapacity=5

    Para um endpoint reconhecedor de entidades, use o seguinte comando da CLI AWS:

    aws application-autoscaling put-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction \ --schedule "cron(0 12 * * ? *)" \ --scalable-target-action MinCapacity=2,MaxCapacity=5

Removendo a escalabilidade programada

Para remover a escalabilidade programada de um endpoint, você usa comandos da CLI AWS para excluir a ação agendada e, em seguida, cancelar o registro do destino escalável.

Para remover a escalabilidade programada
  1. Excluir as ações programadas. Os exemplos a seguir excluem uma ação programada específica.

    Para obter um documento de classificação de endpoint, use o comando AWS a seguir:

    aws application-autoscaling delete-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction

    Para um endpoint reconhecedor de entidades, use o seguinte comando da CLI AWS:

    aws application-autoscaling delete-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction
  2. Cancelar o registro de capacidade pretendida escalável. Os exemplos a seguir cancelam o registro de um destino escalável especificado.

    Para obter um documento de classificação de endpoint, use o comando AWS a seguir:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Para um endpoint reconhecedor de entidades, use o seguinte comando da CLI AWS:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits