Auto Scaling de aplicaciones y Amazon Comprehend - Application Auto Scaling

Auto Scaling de aplicaciones y Amazon Comprehend

Puede escalar la clasificación de documentos de Amazon Comprehend y los extremos del reconocedor de entidades mediante políticas de escalado de seguimiento de destino y escalado programado.

Utilice la siguiente información para ayudarle a integrar Amazon Comprehend con Auto Scaling de aplicaciones.

Si acaba de empezar a escalar la clasificación de documentos de Amazon Comprehend y los extremos del reconocedor de entidades, puede ver configuraciones de ejemplo y detalles sobre el uso de Amazon Comprehend with Auto Scaling de aplicaciones en la siguiente documentación:

Se ha creadp un rol vinculado al servicio para Amazon Comprehend

Los siguientes ejemplos de rol vinculado al servicio se crean automáticamente en su Cuenta de AWS al registrar recursos de Amazon Comprehend como destinos escalables con Auto Scaling de aplicaciones. Este rol permite que Auto Scaling de aplicaciones realice operaciones compatibles dentro de su cuenta. Para obtener más información, consulte Roles vinculados a servicios para Auto Scaling de aplicaciones .

  • AWSServiceRoleForApplicationAutoScaling_ComprehendEndpoint

Entidad de seguridad de servicio utilizada por el rol vinculado al servicio

El rol vinculado al servicio de la sección anterior solo puede ser asumido por la entidad de seguridad de servicio autorizada por las relaciones de confianza definidas para el rol. El rol vinculado al servicio utilizado por Auto Scaling de aplicaciones concede acceso la siguiente entidad de seguridad de servicio:

  • comprehend.application-autoscaling.amazonaws.com

Registro de recursos de Amazon Comprehend como destinos escalables con Auto Scaling de aplicaciones

Auto Scaling de aplicaciones requiere un destino escalable antes de poder crear políticas de escalado o acciones programadas para una clasificación de documentos de Amazon Comprehend o punto de enlace del reconocedor de entidades. Un destino escalable es un recurso que se puede escalar horizontalmente o reducir horizontalmente con Auto Scaling de aplicaciones. Los destinos escalables se identifican de forma única mediante la combinación de ID de recurso, dimensión escalable y espacio de nombres.

Para configurar el escalado automático mediante el CLI de AWS o uno de los SDK de AWS puede utilizar las siguientes opciones:

  • AWS CLI:

    Llame al comando register-scalable-target para un punto de enlace de clasificación de documentos. En el ejemplo siguiente se registra el número deseado de unidades de inferencia que utilizará el modelo para un punto de enlace del clasificador de documentos utilizando el ARN del extremo, con una capacidad mínima de una unidad de inferencia y una capacidad máxima de tres unidades de inferencia.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:us-west-2:123456789012:document-classifier-endpoint/EXAMPLE \ --min-capacity 1 \ --max-capacity 3

    Llamada a un comando register-scalable-target para un punto de enlace del reconocedor de entidades. En el ejemplo siguiente se registra el número deseado de unidades de inferencia que el modelo utilizará para un reconocedor de entidades utilizando el ARN del extremo, con una capacidad mínima de una unidad de inferencia y una capacidad máxima de tres unidades de inferencia.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:us-west-2:123456789012:entity-recognizer-endpoint/EXAMPLE \ --min-capacity 1 \ --max-capacity 3
  • AWS SDK:

    Llame a la operación RegisterScalableTarget y proporcione ResourceId, ScalableDimension, ServiceNamespace, MinCapacity y MaxCapacity como parámetros.