アマゾン SageMaker Debugger - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

アマゾン SageMaker Debugger

Amazon を使って、リアルタイムでのトレーニングジョブのデバッグ、モニタリング、プロファイリング、非収束状態の検出、ボトルネックの排除によるリソース使用率の最適化、機械学習モデルのコスト削減を行います。 SageMaker デバッガー。

アマゾン SageMaker デバッガーの機能

機械学習 (ML) トレーニングジョブには、システムのボトルネック、オーバーフィット、活性化関数の飽和、勾配の消失などの問題が発生し、モデルのパフォーマンスを低下させる場合があります。

SageMaker デバッガーは、トレーニングジョブをプロファイリングおよびトレーニングジョブをデバッグして、このような問題を解決し、ML モデルのコンピューティングリソースの使用率とパフォーマンスを向上させます。デバッガーは、トレーニングの異常が見つかったときにアラートを送信し、問題に対してアクションを取り、収集したメトリクスとテンソルを視覚化することで問題の根本原因を特定するツールを提供します。

SageMaker デバッガーは Apache MXNet をサポートしています TensorFlow, PyTorch、および XGBoost。利用可能なフレームワークとバージョンの詳細については、「サポート対象のアルゴリズムとフレームワーク」を参照してください。


                Amazon の仕組みの概要 SageMaker デバッガーは動作します。

デバッガーのワークフローの概要は次のとおりです。

  1. 設定する SageMaker デバッガーによるトレーニングジョブです。

  2. トレーニングジョブを開始し、トレーニングの問題をリアルタイムにモニタリングします。

  3. アラートを受け取り、トレーニングの問題に対して迅速なアクションを取ります。

  4. トレーニングレポート、問題を解決するための提案、トレーニングジョブに関するインサイトを受け取ります。

  5. トレーニングの問題とボトルネックの詳細な分析を調べます。

  6. デバッガーが示す提案を考慮しながら問題を修正し、モデルを最適化して目標精度を達成するまでステップ 1~5 を繰り返します。

- SageMaker デバッガー開発者ガイドでは、次のトピックを具体的に説明します。