Dimensionamento programmato - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Dimensionamento programmato

Con la scalabilità pianificata, puoi adattare il provisioning degli endpoint alle tue esigenze di capacità secondo una pianificazione specifica. La scalabilità programmata regola automaticamente il numero di unità di inferenza per far fronte ai picchi di utilizzo in momenti specifici. È possibile utilizzare la scalabilità pianificata per gli endpoint di classificazione dei documenti e gli endpoint di riconoscimento delle entità. Per ulteriori informazioni sulla scalabilità pianificata, vedere Scalabilità pianificata per Application Auto Scaling.

Nota

I seguenti esempi sono formattati per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con un accento circonflesso (^).

Configurazione del ridimensionamento pianificato

Per configurare la scalabilità pianificata per un endpoint, si utilizzano i comandi AWS CLI per registrare un target scalabile e quindi creare un'azione pianificata. L'obiettivo scalabile definisce le unità di inferenza come risorsa utilizzata per regolare il provisioning degli endpoint e l'azione pianificata controlla la scalabilità automatica della capacità fornita in momenti specifici.

Per impostare la scalabilità pianificata
  1. Registrazione di una destinazione dimensionabile. Gli esempi seguenti registrano un obiettivo scalabile per regolare il provisioning degli endpoint con una capacità minima di 1 unità di inferenza e una capacità massima di 2 unità di inferenza.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Crea un'azione pianificata. Gli esempi seguenti creano un'azione pianificata per regolare automaticamente la capacità fornita ogni giorno alle 12:00 UTC con un minimo di 2 unità di inferenza e un massimo di 5 unità di inferenza. Per ulteriori informazioni sulle espressioni cronologiche e sul ridimensionamento pianificato, vedere Schedule expression.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling put-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction \ --schedule "cron(0 12 * * ? *)" \ --scalable-target-action MinCapacity=2,MaxCapacity=5

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling put-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction \ --schedule "cron(0 12 * * ? *)" \ --scalable-target-action MinCapacity=2,MaxCapacity=5

Rimozione del ridimensionamento pianificato

Per rimuovere il ridimensionamento pianificato per un endpoint, si utilizzano i comandi AWS CLI per eliminare l'azione pianificata e quindi annullare la registrazione dell'obiettivo scalabile.

Per rimuovere il ridimensionamento pianificato
  1. Eliminare l'azione pianificata. I seguenti esempi eliminano un'azione pianificata specificata.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling delete-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling delete-scheduled-action \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --scheduled-action-name TestScheduledAction
  2. Annullare la registrazione di una destinazione scalabile. I seguenti esempi annullano la registrazione di un target scalabile specificato.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits