Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Les exemples de code suivants montrent comment créer, utiliser et gérer un débit provisionné avec AWS CLI et Python. SDK
Créez un débit provisionné sans engagement appelé sur la MyPT
base d'un modèle personnalisé appelé MyCustomModel
qui a été personnalisé à partir du Anthropic Claude modèle v2.1 en exécutant la commande suivante dans un terminal.
aws bedrock create-provisioned-model-throughput \ --model-units 1 \ --provisioned-model-name MyPT \ --model-id arn:aws:bedrock:us-east-1::custom-model/anthropic.claude-v2:1:200k/MyCustomModel
La réponse renvoie unprovisioned-model-arn
. Prévoyez un peu de temps pour terminer la création. Pour vérifier son état, indiquez le nom ou ARN le modèle provisionné comme indiqué provisioned-model-id
dans la commande suivante.
aws bedrock get-provisioned-model-throughput \ --provisioned-model-id MyPT
Modifiez le nom du débit provisionné et associez-le à un autre modèle personnalisé à partir de Anthropic Claude v2.1.
aws bedrock update-provisioned-model-throughput \ --provisioned-model-id MyPT \ --desired-provisioned-model-name MyPT2 \ --desired-model-id arn:aws:bedrock:us-east-1::custom-model/anthropic.claude-v2:1:200k/MyCustomModel2
Exécutez l'inférence avec votre modèle provisionné mis à jour à l'aide de la commande suivante. Vous devez fournir le ARN modèle provisionné, renvoyé dans la UpdateProvisionedModelThroughput
réponse, sous la forme demodel-id
. La sortie est écrite dans un fichier nommé output.txt
dans votre dossier actuel.
aws bedrock-runtime invoke-model \
--model-id ${provisioned-model-arn}
\
--body '{"inputText": "What is AWS?", "textGenerationConfig": {"temperature": 0.5}}' \
--cli-binary-format raw-in-base64-out \
output.txt
Supprimez le débit provisionné à l'aide de la commande suivante. Le débit provisionné ne vous sera plus facturé.
aws bedrock delete-provisioned-model-throughput --provisioned-model-id MyPT2