Amazon SageMaker デバッガーアーキテクチャ

このトピックでは、Amazon SageMaker Debugger ワークフローの概要について説明します。

デバッガーは、パフォーマンスの最適化のためのプロファイリング機能をサポートして、システムのボトルネックや低使用率などのコンピューティングの問題を特定し、ハードウェアリソースの使用率を大規模に最適化するのに役立ちます。

モデルの最適化のためのデバッガーのデバッグ機能は、勾配降下法やそれに類する最適化アルゴリズムを使って損失関数を最小化する際に発生し得る、非収束トレーニングの問題を分析することです。

次の図は、 SageMaker デバッガーのアーキテクチャを示しています。太い境界線で囲まれているブロックは、デバッガーがトレーニングジョブを分析するために管理するものです。

デバッガーは、トレーニングジョブの次のデータをセキュアな Amazon S3 バケットに保存します。

出力テンソル - ML モデルのトレーニング中にフォワードパスとバックワードパスで継続的に更新されるスカラーとモデルパラメータのコレクション。出力テンソルには、スカラー値 (精度と損失) と行列 (重み、勾配、入力層、出力層) が含まれます。

注記
デフォルトでは、デバッガーはデバッガー固有のパラメータを SageMaker 推定器に設定せずに SageMaker トレーニングジョブをモニタリングおよびデバッグします。デバッガーは 500 ミリ秒ごとにシステムメトリクスを収集し、500 ステップごとに基本的な出力テンソル (損失や精度などのスカラー出力) を収集します。また、ProfilerReport ルールを実行して、システムメトリクスを分析し、Studio デバッガーインサイトダッシュボードとプロファイリングレポートに集約します。デバッガーは、セキュアな Amazon S3 バケットに出力データを保存します。

デバッガーの組み込みルールは、S3 バケットに収集されたトレーニングデータを処理することで機械学習モデルを評価するように設計された処理コンテナで実行されます (「データの処理とモデルの評価」を参照)。組み込みルールは、デバッガーによって完全に管理されます。また、モデルに合わせてカスタマイズした独自のルールを作成し、モニタリングしたい問題を監視することもできます。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

サポート対象のアルゴリズムとフレームワーク

チュートリアル

Amazon SageMaker デバッガーアーキテクチャ

注記