Conditions préalables à l'inférence par lots - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Conditions préalables à l'inférence par lots

Pour effectuer une inférence par lots, vous devez remplir les conditions préalables suivantes :

  1. Assurez-vous qu'une IAM identité dispose des autorisations nécessaires pour soumettre et gérer des tâches d'inférence par lots.

  2. Préparez votre ensemble de données et chargez-le dans un compartiment Amazon S3.

  3. Créez un compartiment S3 pour vos données de sortie.

Les étapes suivantes sont facultatives :

Autorisations requises pour l'inférence par lots

Pour qu'une IAM identité puisse soumettre et gérer des tâches d'inférence par lots, vous devez la configurer avec les autorisations nécessaires. Vous pouvez joindre la AmazonBedrockFullAccesspolitique pour accorder les autorisations appropriées au rôle.

Pour limiter les autorisations aux seules actions utilisées pour l'inférence par lots, associez la politique basée sur l'identité suivante à un rôle : IAM

{ "Version": "2012-10-17", "Statement": [ { "Sid": "PermissionsBatchInference", "Effect": "Allow", "Action": [ "bedrock:ListFoundationModels", "bedrock:GetFoundationModel", "bedrock:TagResource", "bedrock:UntagResource", "bedrock:ListTagsForResource", "bedrock:CreateModelInvocationJob", "bedrock:GetModelInvocationJob", "bedrock:ListModelInvocationJobs", "bedrock:StopModelInvocationJob" ], "Resource": "*" } ] }

Vous pouvez restreindre davantage les autorisations en omettant des actions ou en spécifiant des ressources et des clés de condition. Une IAM identité peut appeler API des opérations sur des ressources spécifiques. Si vous spécifiez une API opération qui ne peut pas être utilisée sur la ressource spécifiée dans la politique, Amazon Bedrock renvoie une erreur.

Les tâches d'inférence par lots utilisent les types de model-invocation-job ressources foundation-modelcustom-model, et. Vous pouvez limiter les autorisations en spécifiant ces ressources dans le Resource champ. Par exemple, la politique suivante permet à un utilisateur possédant l'ID de compte de 123456789012 créer des tâches d'inférence par lots dans la us-west-2 région, à l'aide du Anthropic Claude 3 Haiku modèle :

{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateBatchInferenceJob", "Effect": "Allow", "Action": [ "bedrock:CreateModelInvocationJob" ], "Resource": [ "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*" ] } ] }