建立批次推論任務

使用執行模型推論的檔案設定 Amazon S3 儲存貯體之後，您可以建立批次推論任務。開始之前，請檢查您是否根據中所述的說明設定檔案格式化和上傳批次推論資料。

注意

若要使用 VPC 提交批次推論任務，您必須使用 API。選取 API 索引標籤，了解如何包含 VPC 組態。

若要了解如何建立批次推論任務，請選擇您偏好方法的索引標籤，然後遵循下列步驟：

Console

建立批次推論任務

AWS Management Console 使用具有使用 Amazon Bedrock 主控台許可的 IAM 身分登入。然後，開啟位於 https：//https://console.aws.amazon.com/bedrock 的 Amazon Bedrock 主控台。
從左側導覽窗格中，選取批次推論。
在批次推論任務區段中，選擇建立任務。
在任務詳細資訊區段中，為批次推論任務提供任務名稱，然後選擇選取模型，以選取要用於批次推論任務的模型。
在輸入資料區段中，選擇瀏覽 S3，並為批次推論任務選取 S3 位置。批次推論會在該 S3 位置處理所有 JSONL 和隨附的內容檔案，無論該位置是 S3 資料夾還是單一 JSONL 檔案。

注意
如果輸入資料位於 S3 儲存貯體中，該儲存貯體與您提交任務的 S3 儲存貯體屬於不同的帳戶，您必須使用 API 來提交批次推論任務。若要了解如何執行此操作，請選取上方的 API 標籤。
在輸出資料區段中，選擇瀏覽 S3 並選取 S3 位置，以儲存批次推論任務中的輸出檔案。根據預設，輸出資料將由加密 AWS 受管金鑰。若要選擇自訂 KMS 金鑰，請選取自訂加密設定（進階），然後選擇金鑰。如需 Amazon Bedrock 資源加密和設定自訂 KMS 金鑰的詳細資訊，請參閱資料加密。

注意
如果您打算將輸出資料寫入 S3 儲存貯體，而該儲存貯體屬於與提交任務不同的帳戶，則必須使用 API 來提交批次推論任務。若要了解如何執行此操作，請選取上方的 API 標籤。
在服務存取區段中，選取下列其中一個選項：
- 使用現有服務角色 — 從下拉式清單中選取服務角色。如需有關使用適當許可權設定自訂角色的詳細資訊，請參閱批次推論的必要許可。
- 建立並使用新的服務角色 — 輸入服務角色的名稱。
（選用）若要將標籤與批次推論任務建立關聯，請展開標籤區段，並為每個標籤新增索引鍵和選用值。如需詳細資訊，請參閱標記 Amazon Bedrock 資源。
選擇 Create batch inference job (建立批次推論任務)。

API

若要建立批次推論任務，請使用 Amazon Bedrock 控制平面端點傳送 CreateModelInvocationJob 請求。

下列是必要欄位：

欄位	使用案例
jobName	指定任務的名稱。
roleArn	指定具有建立和管理任務許可的服務角色的 Amazon Resource Name (ARN)。如需詳細資訊，請參閱建立用於批次推論的自訂服務角色。
modelId	指定要在推論中使用的模型 ID 或 ARN。
inputDataConfig	指定包含輸入資料的 S3 位置。批次推論會在該 S3 位置處理所有 JSONL 和隨附的內容檔案，無論該位置是 S3 資料夾還是單一 JSONL 檔案。如需詳細資訊，請參閱格式化和上傳批次推論資料。
outputDataConfig	指定要寫入模型回應的 S3 位置。

下列欄位為選用欄位：

欄位	使用案例
timeoutDurationInHours	以小時為單位指定任務逾時的持續時間。
標籤	指定要與任務建立關聯的任何標籤。如需詳細資訊，請參閱標記 Amazon Bedrock 資源。
vpcConfig	指定要在任務期間用來保護資料的 VPC 組態。如需詳細資訊，請參閱使用 VPC 保護批次推論任務。
clientRequestToken	為確保 API 請求僅完成一次。如需詳細資訊，請參閱確保冪等性。

回應會傳回 jobArn，您可以在執行其他批次推論相關的 API 呼叫時用來參考任務。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

【選用】設定 VPC

監控作業