本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
批次推論的先決條件
若要執行批次推論,您必須滿足下列先決條件:
-
確保IAM身分具有提交和管理批次推論任務 的必要許可。
-
準備資料集並將其上傳至 Amazon S3 儲存貯體。
-
為您的輸出資料建立 S3 儲存貯體。
下列步驟為選用:
-
為具有適當許可的批次推論工作建立自訂 AWS Identity and Access Management (IAM) 服務角色。如果您打算使用 AWS Management Console 自動為您建立服務角色,則可以略過此先決條件。
-
設定 VPC來保護 S3 中的資料,同時執行批次推論。如果您不需要使用 ,可以略過此步驟VPC。
批次推論的必要許可
若要讓IAM身分提交和管理批次推論任務,您必須使用必要的許可進行設定。您可以連接AmazonBedrockFullAccess政策,將適當的許可授予角色。
若要將許可限制為僅用於批次推論的動作,請將下列身分型政策連接至IAM角色:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "PermissionsBatchInference", "Effect": "Allow", "Action": [ "bedrock:ListFoundationModels", "bedrock:GetFoundationModel", "bedrock:TagResource", "bedrock:UntagResource", "bedrock:ListTagsForResource", "bedrock:CreateModelInvocationJob", "bedrock:GetModelInvocationJob", "bedrock:ListModelInvocationJobs", "bedrock:StopModelInvocationJob" ], "Resource": "*" } ] }
您可以省略動作或指定資源和條件索引鍵 來進一步限制許可。IAM 身分可以呼叫特定資源API的操作。如果您指定的API操作無法在政策中指定的資源上使用,Amazon Bedrock 會傳回錯誤。
批次推論任務使用 foundation-model
、 custom-model
和資源model-invocation-job
類型。您可以在 Resource
欄位中指定這些資源,以縮小許可的範圍。例如,下列政策允許具有帳戶 ID 的使用者使用 建立us-west-2
區域中的123456789012
批次推論任務 Anthropic Claude 3 Haiku 模型:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateBatchInferenceJob", "Effect": "Allow", "Action": [ "bedrock:CreateModelInvocationJob" ], "Resource": [ "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*" ] } ] }