Amazon SageMaker モデルビルディングパイプライン - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker モデルビルディングパイプライン

Amazon SageMaker Model Building Pipelines は、 SageMaker 直接統合を活用する機械学習パイプラインを構築するためのツールです。この統合により、ステップの作成と管理の多くを代行してくれるツールを使用して、パイプラインを作成し、 SageMakerオーケストレーション用のプロジェクトを設定できます。 SageMaker Python SDK を使用してパイプラインを構築することも、パイプライン定義 JSON SageMaker スキーマを使用してパイプラインを作成することもできます

SageMaker Pipelines には、 AWS 他のワークフローサービスと比べて次のような利点があります。

SageMaker インテグレーション

SageMaker Pipelines はと直接統合されているので SageMaker、 AWS 他のサービスとやり取りする必要はありません。また、 SageMaker Pipelines は完全マネージド型のサービスであり、ユーザーに代わってリソースを作成して管理するため、リソースを管理する必要もありません。

SageMaker Python SDK インテグレーション

SageMaker Pipelines は SageMaker Python SDK と統合されているため、すでに使い慣れている高レベルの Python インターフェイスを使用してプログラムでパイプラインを作成できます。 SageMaker Python SDK API リファレンスを表示するには、「パイプライン」を参照してください。 SageMaker Python SDK のコード例については、「Amazon SageMaker モデル構築パイプライン」を参照してください。

SageMaker スタジオインテグレーション

SageMaker Studio には、 end-to-end SageMaker パイプラインエクスペリエンスを管理するための環境が用意されています。Studio を使用すると、 AWS コンソールを使わずにワークフロー全体を管理できます。 SageMaker Studio SageMaker からパイプラインを管理する方法について詳しくは、を参照してください。Studio でパイプラインを表示、追跡、実行する SageMaker SageMaker

データ系統の追跡

SageMaker Pipelines では、パイプライン実行内のデータの履歴を追跡できます。Amazon SageMaker ML リネージトラッキングでは、データの出所、入力として使用された場所、およびそこから生成された出力を分析できます。例えば、個々のデータセットから作成されたモデルを表示したり、個々のモデルの作成に使用されたデータセットを表示したりできます。詳細については、「Amazon SageMaker ML リネージュトラッキング」を参照してください。

ステップの再利用

SageMaker パイプラインでは、キャッシュするステップを指定できます。ステップがキャッシュされると、ステップにインデックスが付けられ、後で同じステップを再度実行するときに再利用できます。その結果、ステップを再度実行しなくても、同じパイプラインの同じステップで以前に実行されたステップの出力を再利用できます。ステップのキャッシュの詳細については、「パイプラインのステップをキャッシュする」を参照してください。