バッチ変換を使用してデータセット全体の推論を取得する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

バッチ変換を使用してデータセット全体の推論を取得する

データセット全体の推論を取得するには、 バッチ変換を使用します。バッチ変換では、トレーニング済みモデルとデータセットを使用してバッチ変換ジョブを作成します。これらのジョブは Amazon S3 に保存する必要があります。バッチ変換ジョブを作成するときに指定した S3 バケットに推論を保存します。バッチ変換は、推論を得るために必要なすべてのコンピューティングリソースを管理します。これには、インスタンスを起動することと、バッチ変換ジョブの完了後にこれらのインスタンスを削除することが含まれます。バッチ変換は、インスタンスノード (エージェント) 内のオブジェクトを使用してデータとモデルの間のやり取りを管理します。

バッチ変換は以下の場合に使用します。

  • データセット全体の推論を取得し、これらの推論のインデックス作成をしてリアルタイムで推論を提供する場合

  • 推論を取得するためにアプリケーション (ウェブやモバイルアプリなど) が呼び出すことができる永続的なエンドポイントが不要である場合

  • SageMaker がホストするエンドポイントによって提供される秒未満のレイテンシーが不要である場合

バッチ変換は、新しいモデルのトレーニングや推論の生成に使用するデータを前処理するために使用することもできます。

次の図は、バッチ変換ジョブのワークフローを示しています。

バッチ変換を実行するには、SageMaker コンソールまたは API を使用してバッチ変換ジョブを作成します。以下を指定します。

  • 変換するデータが保存されている S3 バケットへのパス。

  • が変換ジョブに使用するコンピューティングリソース。コンピューティングリソースは、SageMaker が管理する機械学習 (ML) コンピューティングインスタンスです。

  • ジョブの出力を保存する S3 バケットのパス。

  • 推論を作成するために使用する SageMaker モデルの名前。使用するモデルは、 CreateModel オペレーションまたはコンソールで作成済みであることが必要です。

以下に示しているのは、データセットファイルの具体的な例です。

An example of input file content: Record1-Attribute1, Record1-Attribute2, Record1-Attribute3, ..., Record1-AttributeM Record2-Attribute1, Record2-Attribute2, Record2-Attribute3, ..., Record2-AttributeM Record3-Attribute1, Record3-Attribute2, Record3-Attribute3, ..., Record3-AttributeM ... RecordN-Attribute1, RecordN-Attribute2, RecordN-Attribute3, ..., RecordN-AttributeM

レコードは、単一の入力データ単位です。バッチ変換ジョブのレコードを区切る方法については、「SplitType」を参照してください。

バッチ変換の使用方法の例については、「(オプション)Batch 変換による予測の作成」を参照してください。