Zielverfolgung - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Zielverfolgung

Mit der Zielverfolgung können Sie die Endpunktbereitstellung an Ihre Kapazitätsanforderungen an die Nutzung anpassen. Die Anzahl der Inferenzeinheiten wird automatisch angepasst, sodass die genutzte Kapazität innerhalb eines Zielprozentsatzes der bereitgestellten Kapazität liegt. Sie können die Zielverfolgung verwenden, um vorübergehende Nutzungsspitzen für Ihre Endpunkte zur Dokumentenklassifizierung und Entity Recognizer-Endpunkte zu bewältigen. Weitere Informationen finden Sie unter Zielverfolgungs-Skalierungsrichtlinien für Application Auto Scaling.

Anmerkung

Die folgenden Beispiele sind für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).

Einrichten der Zielverfolgung

Um die Zielverfolgung für einen Endpunkt einzurichten, verwenden Sie AWS CLI-Befehle, um ein skalierbares Ziel zu registrieren und dann eine Skalierungsrichtlinie zu erstellen. Das skalierbare Ziel definiert Inferenzeinheiten als die Ressource, die zur Anpassung der Endpunktbereitstellung verwendet wird, und die Skalierungsrichtlinie definiert die Metriken, die die automatische Skalierung der bereitgestellten Kapazität steuern.

So richten Sie die Zielverfolgung ein
  1. Registrieren eines skalierbaren Ziels In den folgenden Beispielen wird ein skalierbares Ziel registriert, um die Endpunktbereitstellung mit einer Mindestkapazität von 1 Inferenzeinheit und einer Höchstkapazität von 2 Inferenzeinheiten anzupassen.

    Verwenden Sie für einen Endpunkt der Dokumentklassifizierung den folgenden AWS CLI-Befehl:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Verwenden Sie für einen Entity Recognizer-Endpunkt den folgenden AWS CLI-Befehl:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Verwenden Sie den folgenden AWS CLI-Befehl, um die Registrierung des skalierbaren Ziels zu überprüfen:

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. Erstellen Sie eine Konfiguration für die Ziel-Nachverfolgung für die Skalierungsrichtlinie und speichern Sie die Konfiguration in einer Datei namens config.json. Im Folgenden finden Sie ein Beispiel für eine Zielverfolgungskonfiguration, die die Anzahl der Inferenzeinheiten automatisch anpasst, sodass die genutzte Kapazität immer 70 % der bereitgestellten Kapazität ausmacht.

    { "TargetValue": 70, "PredefinedMetricSpecification": { "PredefinedMetricType": "ComprehendInferenceUtilization" } }
  4. Erstellen Sie eine Skalierungsrichtlinie. In den folgenden Beispielen wird eine Skalierungsrichtlinie basierend auf der in der config.json Datei definierten Zielverfolgungskonfiguration erstellt.

    Verwenden Sie für einen Endpunkt der Dokumentklassifizierung den folgenden AWS CLI-Befehl:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    Verwenden Sie für einen Entity Recognizer-Endpunkt den folgenden AWS CLI-Befehl:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

Entfernen der Zielverfolgung

Um die Zielverfolgung für einen Endpunkt zu entfernen, verwenden Sie AWS CLI-Befehle, um die Skalierungsrichtlinie zu löschen und dann das skalierbare Ziel abzumelden.

So entfernen Sie die Zielverfolgung
  1. Löschen Sie die Skalierungsrichtlinie. In den folgenden Beispielen wird eine angegebene Skalierungsrichtlinie gelöscht.

    Verwenden Sie für einen Endpunkt der Dokumentklassifizierung den folgenden AWS CLI-Befehl:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    Verwenden Sie für einen Entity Recognizer-Endpunkt den folgenden AWS CLI-Befehl:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. Melden Sie das skalierbare Ziel ab. In den folgenden Beispielen wird die Registrierung eines angegebenen skalierbaren Ziels aufgehoben.

    Verwenden Sie für einen Endpunkt der Dokumentklassifizierung den folgenden AWS CLI-Befehl:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Verwenden Sie für einen Entity Recognizer-Endpunkt den folgenden AWS CLI-Befehl:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits