Amazon Comprehend und Application Auto Scaling - Application Auto Scaling

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon Comprehend und Application Auto Scaling

Sie können Amazon Comprehend Dokumentenklassifizierung und Entity Recognizer Endpunkte mit Hilfe von Zielverfolgungs-Skalierungsrichtlinien und geplanter Skalierung skalieren.

Die folgenden Informationen helfen Ihnen bei der Integration von Amazon Comprehend mit Application Auto Scaling.

Service-verknüpfte Rolle für Amazon Comprehend erstellt

Die folgende serviceverknüpfte Rolle wird automatisch in Ihrem erstellt AWS-Konto , wenn Sie Amazon Comprehend-Ressourcen als skalierbare Ziele mit Application Auto Scaling registrieren. Mit dieser Rolle kann Application Auto Scaling unterstützte Operationen innerhalb Ihres Kontos durchführen. Weitere Informationen finden Sie unter Servicegebundene Rollen für Application Auto Scaling.

  • AWSServiceRoleForApplicationAutoScaling_ComprehendEndpoint

Von der dienstgebundenen Rolle verwendeter Hauptdienst

Die im vorigen Abschnitt beschriebene dienstgebundene Rolle kann nur vom Hauptdienst übernommen werden, der durch die für die Rolle definierten vertrauenswürdigen Beziehungen autorisiert ist. Die von Application Auto Scaling verwendete dienstgebundene Rolle gewährt Zugriff auf den folgenden Hauptdienst:

  • comprehend.application-autoscaling.amazonaws.com

Registrierung von Amazon Comprehend Ressourcen als skalierbare Ziele mit Application Auto Scaling

Application Auto Scaling erfordert ein skalierbares Ziel, bevor Sie Skalierungsrichtlinien oder geplante Aktionen für einen Amazon Comprehend Document Classification oder Entity Recognizer Endpunkt erstellen können. Ein skalierbares Ziel ist eine Ressource, die dank Application Auto Scaling auf- und abskaliert werden kann. Skalierbare Ziele werden eindeutig durch die Kombination von Ressourcen-ID, skalierbarer Dimension und Namespace identifiziert.

Um Auto Scaling mit der AWS CLI oder einem der AWS SDKs zu konfigurieren, können Sie die folgenden Optionen verwenden:

  • AWS CLI:

    Rufen Sie den Befehl register-scalable-target für einen Endpunkt der Dokumentenklassifizierung auf. Das folgende Beispiel registriert die gewünschte Anzahl von Inferenzeinheiten, die vom Modell für einen Dokumentenklassifikator-Endpunkt verwendet werden sollen, unter Verwendung des ARN des Endpunkts, mit einer Mindestkapazität von einer Inferenzeinheit und einer Höchstkapazität von drei Inferenzeinheiten.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:us-west-2:123456789012:document-classifier-endpoint/EXAMPLE \ --min-capacity 1 \ --max-capacity 3

    Bei Erfolg gibt dieser Befehl den ARN des skalierbaren Ziels zurück.

    { "ScalableTargetARN": "arn:aws:application-autoscaling:region:account-id:scalable-target/1234abcd56ab78cd901ef1234567890ab123" }

    Rufen Sie den Befehl register-scalable-target für einen Entity Recognizer Endpunkt auf. Das folgende Beispiel registriert die gewünschte Anzahl von Inferenzeinheiten, die vom Modell für einen Entity Recognizer unter Verwendung der ARN des Endpunkts verwendet werden sollen, mit einer Mindestkapazität von einer Inferenzeinheit und einer Höchstkapazität von drei Inferenzeinheiten.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:us-west-2:123456789012:entity-recognizer-endpoint/EXAMPLE \ --min-capacity 1 \ --max-capacity 3

    Bei Erfolg gibt dieser Befehl den ARN des skalierbaren Ziels zurück.

    { "ScalableTargetARN": "arn:aws:application-autoscaling:region:account-id:scalable-target/1234abcd56ab78cd901ef1234567890ab123" }
  • AWS SDK:

    Rufen Sie den Vorgang RegisterScalableTarget auf und geben Sie ResourceId, ScalableDimension, ServiceNamespace, MinCapacity, und MaxCapacity als Parameter an.

Wenn Sie gerade erst mit Application Auto Scaling beginnen, finden Sie in der folgenden Dokumentation weitere nützliche Informationen zur Skalierung Ihrer Amazon Comprehend-Ressourcen:

Automatische Skalierung mit Endpunkten im Amazon Comprehend Developer Guide