キャッシュパイプラインの手順 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

キャッシュパイプラインの手順

Amazon SageMaker Pipelines では、ステップキャッシュを使用して、パイプラインを再実行する際の時間とリソースを節約できます。ステップキャッシュは、ステップの設定と入力が同じである場合、ステップの以前の成功した実行の出力を (再計算の代わりに) 再利用します。これにより、同じパラメータでパイプラインの再実行全体で一貫した結果を実現できます。次のトピックでは、パイプラインのステップキャッシュを設定して有効にする方法について説明します。

ステップ署名キャッシュを使用すると、パイプラインは、特定の属性に対して同じ値を持つ現在のパイプラインステップの以前の実行を検索しようとします。見つかった場合、パイプラインはステップを再計算するのではなく、前の実行からの出力を伝達します。チェックされる属性はステップタイプに固有のもので、パイプラインステップタイプ別のデフォルトのキャッシュキー属性 にリストされています。

ステップのキャッシュをオプトインする必要があります。デフォルトではオフになっています。ステップのキャッシュをオンにするときは、タイムアウトも定義する必要があります。このタイムアウトは、前回の実行時間からどのくらい経っても再利用の候補として残せるのかを定義します。

ステップキャッシュは実行の成功のみを考慮します。失敗した実行を再利用することはありません。タイムアウト期間内に複数の成功した実行が存在する場合、パイプラインは最新の成功した実行の結果を使用します。タイムアウト期間中に成功した実行が一致しない場合、パイプラインはステップを再実行します。エグゼキュターが条件を満たすが進行中である以前の実行を検出した場合、両方のステップは実行を継続し、成功すればキャッシュを更新します。

ステップのキャッシュでは個々のパイプラインのみが対象となるため、ステップ署名が一致しても別のパイプラインのステップを再利用することはできません。

ステップのキャッシュは、次のステップタイプに使用できます。