Amazon SageMaker デバッガーアーキテクチャ - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker デバッガーアーキテクチャ

このトピックでは、Amazon SageMaker Debugger ワークフローの概要について説明します。

デバッガーは、パフォーマンスの最適化のためのプロファイリング機能をサポートして、システムのボトルネックや低使用率などのコンピューティングの問題を特定し、ハードウェアリソースの使用率を大規模に最適化するのに役立ちます。

モデルの最適化のためのデバッガーのデバッグ機能は、勾配降下法やそれに類する最適化アルゴリズムを使って損失関数を最小化する際に発生し得る、非収束トレーニングの問題を分析することです。

次の図は、 SageMaker デバッガーのアーキテクチャを示しています。太い境界線で囲まれているブロックは、デバッガーがトレーニングジョブを分析するために管理するものです。


                Amazon  SageMaker Debugger の仕組みの概要。

デバッガーは、トレーニングジョブの次のデータをセキュアな Amazon S3 バケットに保存します。

  • 出力テンソル - ML モデルのトレーニング中にフォワードパスとバックワードパスで継続的に更新されるスカラーとモデルパラメータのコレクション。出力テンソルには、スカラー値 (精度と損失) と行列 (重み、勾配、入力層、出力層) が含まれます。

    注記

    デフォルトでは、デバッガーはデバッガー固有のパラメータを SageMaker 推定器に設定せずに SageMaker トレーニングジョブをモニタリングおよびデバッグします。デバッガーは 500 ミリ秒ごとにシステムメトリクスを収集し、500 ステップごとに基本的な出力テンソル (損失や精度などのスカラー出力) を収集します。また、ProfilerReport ルールを実行して、システムメトリクスを分析し、Studio デバッガーインサイトダッシュボードとプロファイリングレポートに集約します。デバッガーは、セキュアな Amazon S3 バケットに出力データを保存します。

デバッガーの組み込みルールは、S3 バケットに収集されたトレーニングデータを処理することで機械学習モデルを評価するように設計された処理コンテナで実行されます (「データの処理とモデルの評価」を参照)。組み込みルールは、デバッガーによって完全に管理されます。また、モデルに合わせてカスタマイズした独自のルールを作成し、モニタリングしたい問題を監視することもできます。