Amazon Comprehend e Application Auto Scaling - Application Auto Scaling

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon Comprehend e Application Auto Scaling

Puoi dimensionare la classificazione dei documenti e gli endpoint di riconoscimento delle entità di Amazon Comprehend utilizzando le policy di dimensionamento con monitoraggio degli obiettivi e il dimensionamento pianificato.

Utilizza le informazioni riportate di seguito per semplificare l'integrazione di Amazon Comprehend con Application Auto Scaling.

Ruolo collegato ai servizi creato per Amazon Comprehend

Il seguente ruolo collegato ai servizi viene creato automaticamente al Account AWS momento della registrazione delle risorse Amazon Comprehend come destinazioni scalabili con Application Auto Scaling. Questo ruolo consente ad Application Auto Scaling di eseguire le operazioni supportate all'interno dell'account. Per ulteriori informazioni, consulta Ruoli collegati ai servizi per Application Auto Scaling.

  • AWSServiceRoleForApplicationAutoScaling_ComprehendEndpoint

Principale del servizio utilizzato dal ruolo collegato ai servizi

Il ruolo collegato ai servizi nella sezione precedente può essere assunto solo dal principale del servizio autorizzato dalle relazioni di attendibilità definite per il ruolo. Il ruolo collegato ai servizi utilizzato da Application Auto Scaling concede l'accesso al seguente principale del servizio:

  • comprehend.application-autoscaling.amazonaws.com

Registrazione delle risorse Amazon Comprehend come obiettivi scalabili con Application Auto Scaling

Application Auto Scaling richiede un obiettivo scalabile prima di poter creare policy di dimensionamento o operazioni pianificate per un endpoint di classificazione di documenti o riconoscimento delle entità di Amazon Comprehend. Un obiettivo scalabile è una risorsa la cui dimensione può essere aumentata e ridotta orizzontalmente da Application Auto Scaling. Gli obiettivi scalabili sono identificati in modo univoco dalla combinazione di ID risorsa, dimensione scalabile e spazio dei nomi.

Per configurare la scalabilità automatica utilizzando la AWS CLI o uno AWS degli SDK, puoi utilizzare le seguenti opzioni:

  • AWS CLI:

    Chiama il comando register-scalable-target per un endpoint di classificazione dei documenti. Nell'esempio seguente viene registrato il numero desiderato di unità di inferenza che il modello deve utilizzare per un endpoint di classificazione di documenti utilizzando l'ARN dell'endpoint, con una capacità minima di un'unità di inferenza e una capacità massima di tre unità di inferenza.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:us-west-2:123456789012:document-classifier-endpoint/EXAMPLE \ --min-capacity 1 \ --max-capacity 3

    In caso di esito positivo, il comando restituisce l'ARN dell'obiettivo scalabile.

    { "ScalableTargetARN": "arn:aws:application-autoscaling:region:account-id:scalable-target/1234abcd56ab78cd901ef1234567890ab123" }

    Chiama il comando register-scalable-target per un endpoint di riconoscimento delle entità. Nell'esempio seguente viene registrato il numero desiderato di unità di inferenza che il modello deve utilizzare per un riconoscitore delle entità utilizzando l'ARN dell'endpoint, con una capacità minima di un'unità di inferenza e una capacità massima di tre unità di inferenza.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:us-west-2:123456789012:entity-recognizer-endpoint/EXAMPLE \ --min-capacity 1 \ --max-capacity 3

    In caso di esito positivo, il comando restituisce l'ARN dell'obiettivo scalabile.

    { "ScalableTargetARN": "arn:aws:application-autoscaling:region:account-id:scalable-target/1234abcd56ab78cd901ef1234567890ab123" }
  • AWS SDK:

    Chiama l'operazione RegisterScalableTarget e fornisci ResourceId, ScalableDimension, ServiceNamespace, MinCapacity e MaxCapacity come parametri.

Se hai appena iniziato a usare Application Auto Scaling, puoi trovare ulteriori informazioni utili sulla scalabilità delle tue risorse Amazon Comprehend nella seguente documentazione:

Scalabilità automatica con gli endpoint nella Guida per gli sviluppatori di Amazon Comprehend