Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Monitoraggio degli obiettivi
Con il monitoraggio degli obiettivi, puoi regolare il provisioning degli endpoint per adattarlo alle tue esigenze di capacità in base all'utilizzo. Il numero di unità di inferenza si regola automaticamente in modo che la capacità utilizzata rientri nella percentuale target della capacità fornita. È possibile utilizzare il monitoraggio degli obiettivi per far fronte a picchi temporanei di utilizzo degli endpoint di classificazione dei documenti e degli endpoint di riconoscimento delle entità. Per ulteriori informazioni, consulta Policy di dimensionamento con monitoraggio degli obiettivi per Application Auto Scaling.
Nota
I seguenti esempi sono formattati per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con un accento circonflesso (^).
Configurazione del tracciamento dei bersagli
Per configurare il tracciamento delle destinazioni per un endpoint, si utilizzano AWS i comandi CLI per registrare un target scalabile e quindi creare una politica di scalabilità. Il target scalabile definisce le unità di inferenza come risorsa utilizzata per regolare il provisioning degli endpoint e la policy di scalabilità definisce le metriche che controllano la scalabilità automatica della capacità fornita.
Per impostare il tracciamento degli obiettivi
-
Registrazione di una destinazione dimensionabile. Gli esempi seguenti registrano un target scalabile per regolare il provisioning degli endpoint con una capacità minima di 1 unità di inferenza e una capacità massima di 2 unità di inferenza.
Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2 -
Per verificare la registrazione del target scalabile, utilizza il seguente comando AWS CLI:
aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id
endpoint ARN
-
Crea una configurazione di tracciamento della destinazione per la politica di ridimensionamento e salva la configurazione in un file chiamato.
config.json
Di seguito è riportato un esempio di configurazione di tracciamento del target che regola automaticamente il numero di unità di inferenza in modo che la capacità utilizzata sia sempre il 70% della capacità fornita.{ "TargetValue": 70, "PredefinedMetricSpecification": { "PredefinedMetricType": "ComprehendInferenceUtilization" } }
-
Crea una politica di scalabilità. Gli esempi seguenti creano una politica di scalabilità basata sulla configurazione di tracciamento del target definita nel
config.json
file.Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:
aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.jsonPer un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS
aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json
Rimuovere il tracciamento dei bersagli
Per rimuovere il tracciamento delle destinazioni per un endpoint, si utilizzano AWS i comandi CLI per eliminare la politica di scalabilità e quindi annullare la registrazione della destinazione scalabile.
Per rimuovere il tracciamento degli obiettivi
-
Eliminare la politica di scalabilità. Gli esempi seguenti eliminano una politica di ridimensionamento specificata.
Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:
aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS
aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
-
Annullare la registrazione di una destinazione scalabile. I seguenti esempi annullano la registrazione di un target scalabile specificato.
Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:
aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnitsPer un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS
aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits