Escalado programado - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Escalado programado

Con el escalado programado, puede ajustar el aprovisionamiento de puntos de conexión para que se adapte a sus necesidades de capacidad según un cronograma específico. El escalado programado ajusta automáticamente el número de unidades de inferencia para adaptarse a los picos de uso en momentos específicos. Puede utilizar el escalado programado para los puntos de conexión de clasificación de documentos y los puntos de conexión del reconocedor de entidades. Para obtener más información sobre el uso del escalado programado, consulte Escalado programado en la Guía del usuario de la aplicación del escalado automático.

nota

Los siguientes ejemplos tienen formato para Unix, Linux y macOS. Para Windows, sustituya la barra diagonal invertida (\) utilizada como carácter de continuación de Unix al final de cada línea por el signo de intercalación (^).

Configurar el escalado programado

Para configurar el escalado programado para un punto de conexión, utilice los comandos CLI de AWSpara registrar un destino escalable y, a continuación, crear una acción programada. El destino escalable define las unidades de inferencia como el recurso que se utiliza para ajustar el aprovisionamiento de puntos de conexión, y la acción programada controla el escalado automático de la capacidad aprovisionada en momentos específicos.

Para configurar el escalado programado
  1. Registrar un destino escalable. Los siguientes ejemplos registran un destino escalable para ajustar el aprovisionamiento de puntos de conexión con una capacidad mínima de 1 unidad de inferencia y una capacidad máxima de 2 unidades de inferencia.

    Para un punto de conexión de clasificación de documentos, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Para un punto de conexión de reconocimiento de entidades, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Crear una acción programada. Los siguientes ejemplos crean una acción programada para ajustar automáticamente la capacidad aprovisionada todos los días a las 12:00 UTC con un mínimo de 2 unidades de inferencia y un máximo de 5 unidades de inferencia. Para obtener más información sobre las expresiones cronológicas y el escalado programado, consulte Programar expresiones.

    Para un punto de conexión de clasificación de documentos, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling put-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction \ --schedule "cron(0 12 * * ? *)" \ --scalable-target-action MinCapacity=2,MaxCapacity=5

    Para un punto de conexión de reconocimiento de entidades, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling put-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction \ --schedule "cron(0 12 * * ? *)" \ --scalable-target-action MinCapacity=2,MaxCapacity=5

Eliminar el escalado programado

Para eliminar el escalado programado de un punto de conexión, utilice los comandos CLI de AWS para eliminar la acción programada y, a continuación, anular el registro del objetivo escalable.

Para configurar el escalado programado
  1. Eliminar la acción programada. Los siguientes ejemplos eliminan una acción programada especificada.

    Para un punto de conexión de clasificación de documentos, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling delete-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction

    Para un punto de conexión de reconocimiento de entidades, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling delete-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction
  2. Anular el registro del destino escalable. En los siguientes ejemplos se anula el registro de un destino escalable específico.

    Para un punto de conexión de clasificación de documentos, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Para un punto de conexión de reconocimiento de entidades, utilice el siguiente comando CLI de AWS:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits