Seguimiento de destino - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Seguimiento de destino

Con el seguimiento de destino, puede ajustar el aprovisionamiento de puntos de conexión para que se adapte a sus necesidades de capacidad en función del uso. El número de unidades de inferencia se ajusta automáticamente para que la capacidad utilizada esté dentro del porcentaje de destino de la capacidad aprovisionada. Puede utilizar el seguimiento de destino para adaptarse a los aumentos temporales de uso de los puntos de conexión de clasificación de documentos y los puntos de conexión del reconocedor de entidades. Para obtener más información, consulte Políticas de escalado de seguimiento de destino para la aplicación del escalado automático.

nota

Los siguientes ejemplos tienen formato para Unix, Linux y macOS. Para Windows, sustituya la barra diagonal invertida (\) utilizada como carácter de continuación de Unix al final de cada línea por el signo de intercalación (^).

Configurar el seguimiento de destino

Para configurar el seguimiento de destino para un punto de conexión, utilice los comandos CLI de AWS para registrar un destino escalable y, a continuación, crear una política de escalado. El destino escalable define las unidades de inferencia como el recurso utilizado para ajustar el aprovisionamiento de puntos de conexión, y la política de escalado define las métricas que controlan el escalado automático de la capacidad aprovisionada.

Para establecer el seguimiento de destino
  1. Registrar un destino escalable. Los siguientes ejemplos registran un destino escalable para ajustar el aprovisionamiento de puntos de conexión con una capacidad mínima de 1 unidad de inferencia y una capacidad máxima de 2 unidades de inferencia.

    Para un punto de conexión de clasificación de documentos, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Para un punto de conexión de reconocimiento de entidades, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Para comprobar el registro del destino escalable, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. Cree una configuración de seguimiento de destino para la política de escalado y guarde la configuración en un archivo denominado config.json. El siguiente es un ejemplo de una configuración de seguimiento de destino que ajusta automáticamente el número de unidades de inferencia para que la capacidad utilizada sea siempre el 70 % de la capacidad aprovisionada.

    { "TargetValue": 70, "PredefinedMetricSpecification": { "PredefinedMetricType": "ComprehendInferenceUtilization" } }
  4. Crear una política de escalado. Los siguientes ejemplos crean una política de escalado basada en la configuración de seguimiento de destino definida en el archivo config.json.

    Para un punto de conexión de clasificación de documentos, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    Para un punto de conexión de reconocimiento de entidades, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

Eliminar el seguimiento de destino

Para eliminar el seguimiento del destino de un punto de conexión, utilice el comando CLI de AWS para eliminar la política de escalado y, a continuación, anular el registro del destino escalable.

Para eliminar el seguimiento de destino
  1. Eliminar la política de escalado. En los siguientes ejemplos se elimina la política de escalado especificada.

    Para un punto de conexión de clasificación de documentos, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    Para un punto de conexión de reconocimiento de entidades, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. Anular el registro del destino escalable. En los siguientes ejemplos se anula el registro de un destino escalable específico.

    Para un punto de conexión de clasificación de documentos, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Para un punto de conexión de reconocimiento de entidades, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits