Monitoraggio degli obiettivi - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitoraggio degli obiettivi

Con il monitoraggio degli obiettivi, puoi regolare il provisioning degli endpoint per adattarlo alle tue esigenze di capacità in base all'utilizzo. Il numero di unità di inferenza si regola automaticamente in modo che la capacità utilizzata rientri nella percentuale target della capacità fornita. È possibile utilizzare il monitoraggio degli obiettivi per far fronte a picchi temporanei di utilizzo degli endpoint di classificazione dei documenti e degli endpoint di riconoscimento delle entità. Per ulteriori informazioni, consulta Policy di dimensionamento con monitoraggio degli obiettivi per Application Auto Scaling.

Nota

I seguenti esempi sono formattati per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con un accento circonflesso (^).

Configurazione del tracciamento dei bersagli

Per configurare il tracciamento delle destinazioni per un endpoint, si utilizzano AWS i comandi CLI per registrare un target scalabile e quindi creare una politica di scalabilità. Il target scalabile definisce le unità di inferenza come risorsa utilizzata per regolare il provisioning degli endpoint e la policy di scalabilità definisce le metriche che controllano la scalabilità automatica della capacità fornita.

Per impostare il tracciamento degli obiettivi
  1. Registrazione di una destinazione dimensionabile. Gli esempi seguenti registrano un target scalabile per regolare il provisioning degli endpoint con una capacità minima di 1 unità di inferenza e una capacità massima di 2 unità di inferenza.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Per verificare la registrazione del target scalabile, utilizza il seguente comando AWS CLI:

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. Crea una configurazione di tracciamento della destinazione per la politica di ridimensionamento e salva la configurazione in un file chiamato. config.json Di seguito è riportato un esempio di configurazione di tracciamento del target che regola automaticamente il numero di unità di inferenza in modo che la capacità utilizzata sia sempre il 70% della capacità fornita.

    { "TargetValue": 70, "PredefinedMetricSpecification": { "PredefinedMetricType": "ComprehendInferenceUtilization" } }
  4. Crea una politica di scalabilità. Gli esempi seguenti creano una politica di scalabilità basata sulla configurazione di tracciamento del target definita nel config.json file.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

Rimuovere il tracciamento dei bersagli

Per rimuovere il tracciamento delle destinazioni per un endpoint, si utilizzano AWS i comandi CLI per eliminare la politica di scalabilità e quindi annullare la registrazione della destinazione scalabile.

Per rimuovere il tracciamento degli obiettivi
  1. Eliminare la politica di scalabilità. Gli esempi seguenti eliminano una politica di ridimensionamento specificata.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. Annullare la registrazione di una destinazione scalabile. I seguenti esempi annullano la registrazione di un target scalabile specificato.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits