Amazon SageMaker デバッガー - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker デバッガー

Amazon SageMaker Debugger を使用して、トレーニングジョブをリアルタイムでデバッグ、監視、プロファイリング、非収束状態の検出、ボトルネックの排除によるリソース使用率の最適化、トレーニング時間の短縮、機械学習モデルのコストの削減を行います。

Amazon SageMaker デバッガ機能

機械学習(ML)トレーニングジョブでは、システムのボトルネック、オーバーフィッティング、飽和活性化機能、消失勾配などの問題が発生し、モデルのパフォーマンスが低下する可能性があります。

SageMaker Debugger は、このような問題を解決し、ML モデルのコンピュートリソース使用率とパフォーマンスを向上させるために、トレーニングジョブをプロファイリングしてデバッグします。デバッガーは、トレーニングの異常が見つかったときにアラートを送信し、問題に対してアクションを実行し、収集されたメトリックとテンソルを視覚化することによってそれらの根本原因を特定するためのツールを提供します。

SageMaker Debugger では、Apache MXNet、TensorFlow、PyTorch、XGBoost がサポートされています。使用可能なフレームワークとバージョンの詳細については、サポートされているフレームワークとアルゴリズム


                Amazon SageMaker デバッガの仕組みの概要

大まかなDebugger ワークフローは次のとおりです。

  1. Debugger で SageMaker トレーニングジョブを設定します。

  2. トレーニングジョブを開始し、リアルタイムでトレーニングの問題を監視します。

  3. アラートを受け取り、トレーニングの問題に対して迅速な対応をとります。

  4. トレーニングレポート、問題を解決するための提案、トレーニングジョブに関するインサイトを受け取ります。

  5. トレーニングの問題とボトルネックの詳細な分析をご覧ください。

  6. Debugger が提供する提案を考慮して、問題を修正し、モデルを最適化して目標精度を達成するまで手順 1 ~ 5 を繰り返します。

SageMaker デバッガー開発者ガイドでは、次のトピックについて説明します。