バッチ推論のコード例

この章のコード例は、バッチ推論ジョブを作成し、その情報を表示して停止する方法を示しています。

言語を選択すると、コードの例が表示されます。

Python

abc.jsonl という名前の JSONL ファイルを作成し、少なくとも最小数のレコードを含むレコードごとに JSON オブジェクトを含めます (「{Model} のバッチ推論ジョブあたりのレコードの最小数」を参照Amazon Bedrock のクォータ）。この例では、 AnthropicClaude 3 Haikuモデルを使用します。次の例は、ファイルの最初の入力 JSON を示しています。


{
    "recordId": "CALL0000001", 
    "modelInput": {
        "anthropic_version": "bedrock-2023-05-31", 
        "max_tokens": 1024,
        "messages": [ 
            { 
                "role": "user", 
                "content": [
                    {
                        "type": "text", 
                        "text": "Summarize the following call transcript: ..." 
                    } 
                ]
            }
        ]
    }
}
... 
# Add records until you hit the minimum

amzn-s3-demo-bucket-input という名前の S3 バケットを作成し、そのバケットにファイルをアップロードします。次に、amzn-s3-demo-bucket-output という名前の S3 バケットを作成して、出力ファイルを書き込みます。次のコードスニペットを実行してジョブを送信し、レスポンスから jobArn を取得します。


import boto3

bedrock = boto3.client(service_name="bedrock")

inputDataConfig=({
    "s3InputDataConfig": {
        "s3Uri": "s3://amzn-s3-demo-bucket-input/abc.jsonl"
    }
})

outputDataConfig=({
    "s3OutputDataConfig": {
        "s3Uri": "s3://amzn-s3-demo-bucket-output/"
    }
})

response=bedrock.create_model_invocation_job(
    roleArn="arn:aws:iam::123456789012:role/MyBatchInferenceRole",
    modelId="anthropic.claude-3-haiku-20240307-v1:0",
    jobName="my-batch-job",
    inputDataConfig=inputDataConfig,
    outputDataConfig=outputDataConfig
)

jobArn = response.get('jobArn')

ジョブの status を返します。


bedrock.get_model_invocation_job(jobIdentifier=jobArn)['status']

失敗したバッチ推論ジョブを一覧表示します。


bedrock.list_model_invocation_jobs(
    maxResults=10,
    statusEquals="Failed",
    sortOrder="Descending"
)

開始したジョブを停止します。


bedrock.stop_model_invocation_job(jobIdentifier=jobArn)

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ジョブの結果を表示する

推論プロファイル: モデル呼び出しリソースをセットアップする