パイプラインの概要 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

パイプラインの概要

Amazon SageMaker パイプラインは、UI またはパイプライン SDKを使用して drag-and-drop定義される、指向非循環グラフ (DAG) 内の一連の相互接続されたステップです。パイプライン定義JSONスキーマ を使用してパイプラインを構築することもできます。このDAGJSON定義は、パイプラインの各ステップの要件と関係に関する情報を提供します。パイプラインの構造DAGは、ステップ間のデータ依存関係によって決まります。これらのデータ依存関係は、ステップの出力のプロパティが別のステップに入力として渡される際に作成されます。次の図は、パイプライン の例ですDAG。

パイプライン指向の非循環グラフの例 (DAG)。
この例では、次のステップDAGが含まれます。
  1. AbaloneProcess処理ステップのインスタンスである は、トレーニングに使用されるデータに対して前処理スクリプトを実行します。例えば、スクリプトは欠落している値を入力したり、数値データを正規化したり、データをトレーニング、検証、テストデータセットに分割したりできます。

  2. AbaloneTrainトレーニングhttps://docs.aws.amazon.com/sagemaker/latest/dg/build-and-manage-steps.html#step-type-trainingステップのインスタンスである は、ハイパーパラメータを設定し、前処理された入力データからモデルをトレーニングします。

  3. AbaloneEval処理ステップの別のインスタンスである は、モデルの精度を評価します。このステップは、データ依存関係の例を示しています。このステップでは、 のテストデータセット出力を使用しますAbaloneProcess

  4. AbaloneMSECond は条件https://docs.aws.amazon.com/sagemaker/latest/dg/build-and-manage-steps.html#step-type-conditionステップのインスタンスで、この例では、モデル評価の結果が特定の制限を下回っていることを確認します mean-square-error。モデルが基準を満たしていない場合、パイプラインの実行は停止します。

  5. パイプラインの実行は、次のステップに進みます。

    1. AbaloneRegisterModel。 は、モデルをバージョニングされたモデルパッケージグループとして Amazon SageMaker Model Registry に登録するRegisterModelステップを SageMaker 呼び出します。

    2. AbaloneCreateModel。 はバッチ変換の準備としてモデルを作成するCreateModelステップを SageMaker 呼び出します。ではAbaloneTransform、 SageMaker は Transform ステップを呼び出して、指定したデータセットにモデル予測を生成します。

以下のトピックでは、パイプラインの基本的な概念について説明します。これらの概念の実装を解説したチュートリアルについては、「パイプラインアクション」を参照してください。