Amazon Comprehend et Application Auto Scaling - Application Auto Scaling

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Amazon Comprehend et Application Auto Scaling

Vous pouvez mettre à l'échelle les points de terminaison de classification de documents et de reconnaissance d'entités Amazon Comprehend à l'aide de politiques de suivi des cibles et d'échelonnement et de mise à l'échelle planifiée.

Utilisez les informations suivantes pour vous aider à intégrer Amazon Comprehend avec Application Auto Scaling.

Rôle lié à un service créé pour Amazon Comprehend

Le rôle lié au service suivant est automatiquement créé dans votre compte Compte AWS lors de l'enregistrement des ressources Amazon Comprehend en tant que cibles évolutives avec Application Auto Scaling. Ce rôle permet à Application Auto Scaling d'effectuer des opérations prises en charge au sein de votre compte. Pour de plus amples informations, veuillez consulter Rôles liés à un service pour Application Auto Scaling.

  • AWSServiceRoleForApplicationAutoScaling_ComprehendEndpoint

Principal du service utilisé par le rôle lié à un service

Le rôle lié à un service dans la section précédente ne peut être assumé que par le principal du service autorisé par les relations d’approbation définies pour le rôle. Le rôle lié à un service utilisé par Application Auto Scaling donne l'accès au principal du service suivant :

  • comprehend.application-autoscaling.amazonaws.com

Enregistrement des ressources Amazon Comprehend en tant que cibles évolutives avec Application Auto Scaling

Application Auto Scaling nécessite une cible évolutive avant que vous puissiez créer des politiques de mise à l'échelle ou des actions planifiées pour un point de terminaison de classification de documents ou de reconnaissance d'entités Amazon Comprehend. Une cible évolutive est une ressource qu'Application Auto Scaling peut augmenter et diminuer. Les cibles évolutives sont identifiées de manière unique par la combinaison de l'ID de ressource, de la dimension évolutive et de l'espace de noms.

Pour configurer le dimensionnement automatique à l'aide de la AWS CLI ou de l'un AWS des SDK, vous pouvez utiliser les options suivantes :

  • AWS CLI:

    Appelez la commande register-scalable-target pour un point de terminaison de classification de documents. L'exemple suivant enregistre le nombre souhaité d'unités d'inférence à utiliser par le modèle pour un point de terminaison de classification de documents en utilisant l'ARN du point de terminaison, avec une capacité minimale d'une unité d'inférence et une capacité maximale de trois unités d'inférence.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:us-west-2:123456789012:document-classifier-endpoint/EXAMPLE \ --min-capacity 1 \ --max-capacity 3

    En cas de réussite, cette commande renvoie l'ARN de la cible évolutive.

    { "ScalableTargetARN": "arn:aws:application-autoscaling:region:account-id:scalable-target/1234abcd56ab78cd901ef1234567890ab123" }

    Appelez la commande register-scalable-target pour un point de terminaison de reconnaissance d'entités. L'exemple suivant enregistre le nombre souhaité d'unités d'inférence à utiliser par le modèle pour une reconnaissance d'entités en utilisant l'ARN du point de terminaison, avec une capacité minimale d'une unité d'inférence et une capacité maximale de trois unités d'inférence.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:us-west-2:123456789012:entity-recognizer-endpoint/EXAMPLE \ --min-capacity 1 \ --max-capacity 3

    En cas de réussite, cette commande renvoie l'ARN de la cible évolutive.

    { "ScalableTargetARN": "arn:aws:application-autoscaling:region:account-id:scalable-target/1234abcd56ab78cd901ef1234567890ab123" }
  • AWS SDK :

    Appelez l'opération RegisterScalableTarget et fournissez ResourceId, ScalableDimension, ServiceNamespace, MinCapacity et MaxCapacity comme paramètres.

Si vous débutez avec Application Auto Scaling, vous trouverez des informations supplémentaires utiles sur le dimensionnement de vos ressources Amazon Comprehend dans la documentation suivante :

Scalabilité automatique avec les points de terminaison dans le Guide du développeur Amazon Comprehend