ステップ 5. パイプラインを実行する - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ステップ 5. パイプラインを実行する

パイプラインを実行します。

このステップでは、ステップ 4 で AWS CloudFormation スタックで作成されたトレーニングパイプラインまたは推論パイプラインを実行します。パイプラインは、内部のプレースホルダーパラメータに具体的な値が入力されるまで実行できません。プレースホルダーパラメータに値を割り当てるこのアクションは、ステップ 5 の主要なアクティビティです。プレースホルダーパラメータには以下が含まれます。

  • 入力、出力、および中間データセットの場所

  • ステップ 2 で開発されたランタイムスクリプトとその他の前処理コードまたは評価コード (トレーニングパイプラインの sm_submit_url など) が格納されている Amazon S3 の場所

  • AWS リージョンの名前

パイプラインを実行する前に、これらのパス値が有効なデータまたはコードを指していることを確認する必要があります。たとえば、Python ランタイムスクリプトの Amazon S3 URL を表すプレースホルダーパラメータを入力する場合、それらのスクリプトをその URL にアップロードする必要があります。パイプラインを実行する担当者は、整合性チェックとデータのアップロードを担当します。パイプラインを定義または作成する人は、これについて何も心配する必要はありません。

パイプラインの成熟度によっては、このステップを定期的に (毎週または毎月) 実行するように自動化されている場合があります。オートメーションには堅牢なモニタリングも必要です。これは重要な領域ですが、本ガイドの対象外です。トレーニングパイプラインの実行には、評価メトリクスをモニタリングするのが適切でしょう。推論パイプラインでは、入力データの分布ドリフトを監視し、可能であれば定期的にラベルを収集して予測精度のドリフトを測定するのが適切でしょう。トレーニングと推論の実行によるこれらの記録は、後で分析できるようにデータベースに記録しておく必要があります。