Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Conditions préalables à l'inférence par lots
Pour effectuer une inférence par lots, vous devez remplir les conditions préalables suivantes :
-
Assurez-vous qu'une IAM identité dispose des autorisations nécessaires pour soumettre et gérer des tâches d'inférence par lots.
-
Préparez votre ensemble de données et chargez-le dans un compartiment Amazon S3.
-
Créez un compartiment S3 pour vos données de sortie.
Les étapes suivantes sont facultatives :
-
Créez un rôle de service personnalisé AWS Identity and Access Management (IAM) pour votre tâche d'inférence par lots avec les autorisations appropriées. Vous pouvez ignorer cette condition préalable si vous prévoyez d'utiliser le AWS Management Console pour créer automatiquement un rôle de service pour vous.
-
Configurez un VPC pour protéger les données de votre S3 lors de l'inférence par lots. Vous pouvez ignorer cette étape si vous n'avez pas besoin d'utiliser unVPC.
Autorisations requises pour l'inférence par lots
Pour qu'une IAM identité puisse soumettre et gérer des tâches d'inférence par lots, vous devez la configurer avec les autorisations nécessaires. Vous pouvez joindre la AmazonBedrockFullAccesspolitique pour accorder les autorisations appropriées au rôle.
Pour limiter les autorisations aux seules actions utilisées pour l'inférence par lots, associez la politique basée sur l'identité suivante à un rôle : IAM
{ "Version": "2012-10-17", "Statement": [ { "Sid": "PermissionsBatchInference", "Effect": "Allow", "Action": [ "bedrock:ListFoundationModels", "bedrock:GetFoundationModel", "bedrock:TagResource", "bedrock:UntagResource", "bedrock:ListTagsForResource", "bedrock:CreateModelInvocationJob", "bedrock:GetModelInvocationJob", "bedrock:ListModelInvocationJobs", "bedrock:StopModelInvocationJob" ], "Resource": "*" } ] }
Vous pouvez restreindre davantage les autorisations en omettant des actions ou en spécifiant des ressources et des clés de condition. Une IAM identité peut appeler API des opérations sur des ressources spécifiques. Si vous spécifiez une API opération qui ne peut pas être utilisée sur la ressource spécifiée dans la politique, Amazon Bedrock renvoie une erreur.
Les tâches d'inférence par lots utilisent les types de model-invocation-job
ressources foundation-model
custom-model
, et. Vous pouvez limiter les autorisations en spécifiant ces ressources dans le Resource
champ. Par exemple, la politique suivante permet à un utilisateur possédant l'ID de compte de 123456789012
créer des tâches d'inférence par lots dans la us-west-2
région, à l'aide du Anthropic Claude 3 Haiku modèle :
{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateBatchInferenceJob", "Effect": "Allow", "Action": [ "bedrock:CreateModelInvocationJob" ], "Resource": [ "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*" ] } ] }