Monitoramento do objetivo - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitoramento do objetivo

Com o rastreamento de destinos, você pode ajustar o provisionamento de endpoints para atender às suas necessidades de capacidade com base no uso. O número de unidades de inferência se ajusta automaticamente para que a capacidade utilizada esteja dentro de uma porcentagem alvo da capacidade provisionada. Você pode usar o rastreamento de destinos para acomodar picos temporários de uso de seus endpoints de classificação de documentos e endpoints de reconhecimento de entidades. Para obter mais informações, consulte Políticas de dimensionamento com monitoramento do objetivo para o Application Auto Scaling.

nota

Os exemplos a seguir estão formatados para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).

Configurando o rastreamento de destinos

Para configurar o rastreamento de destinos para um endpoint, você usa comandos da CLI AWS para registrar um destino escalável e, em seguida, criar uma política de escalabilidade. O destino escalável define as unidades de inferência como o recurso usado para ajustar o provisionamento de endpoints e a política de escalabilidade define as métricas que controlam o ajuste de escala automático da capacidade provisionada.

Para configurar o rastreamento de destinos
  1. Registrar um destino escalável. Os exemplos a seguir registram um destino escalável para ajustar o provisionamento de endpoints com uma capacidade mínima de 1 unidade de inferência e uma capacidade máxima de 2 unidades de inferência.

    Para obter um documento de classificação de endpoint, use o comando AWS a seguir:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Para um endpoint reconhecedor de entidades, use o seguinte comando da CLI AWS:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Para verificar o registro do destino escalável, use o comando AWS a seguir:

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. Crie uma configuração de rastreamento de destino para a política de escalabilidade e salve a configuração em um arquivo chamado config.json. Veja a seguir um exemplo de uma configuração de rastreamento de destinos que ajusta automaticamente o número de unidades de inferência para que a capacidade utilizada seja sempre 70% da capacidade provisionada.

    { "TargetValue": 70, "PredefinedMetricSpecification": { "PredefinedMetricType": "ComprehendInferenceUtilization" } }
  4. Criar uma política de escalabilidade. Os exemplos a seguir criam uma política de escalabilidade com base na configuração de rastreamento de destino definida no arquivo config.json.

    Para obter um documento de classificação de endpoint, use o comando AWS a seguir:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    Para um endpoint reconhecedor de entidades, use o seguinte comando da CLI AWS:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

Removendo o rastreamento de destinos

Para remover o rastreamento de destinos de um endpoint, você usa comandos da CLI AWS para excluir a política de escalabilidade e, em seguida, cancelar o registro do destino escalável.

Para remover o rastreamento de destino
  1. Exclua a política de escalabilidade Os exemplos a seguir excluem a política de escalabilidade especificada.

    Para obter um documento de classificação de endpoint, use o comando AWS a seguir:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    Para um endpoint reconhecedor de entidades, use o seguinte comando da CLI AWS:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. Cancelar o registro de capacidade pretendida escalável. Os exemplos a seguir cancelam o registro de um destino escalável especificado.

    Para obter um documento de classificação de endpoint, use o comando AWS a seguir:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Para um endpoint reconhecedor de entidades, use o seguinte comando da CLI AWS:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits