翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
サポート対象のアルゴリズムとフレームワーク
次の表は、デバッガーがサポートする SageMaker 機械学習フレームワークとアルゴリズムを示しています。
SageMaker-supported frameworks and algorithms | Debugging output tensors |
---|---|
AWS TensorFlow 深層学習コンテナ |
|
AWS PyTorch 深層学習コンテナ |
|
AWS MXNet 深層学習コンテナ |
|
1.0-1、1.2-1、1.3-1 |
|
カスタムトレーニングコンテナ (手動フック登録で TensorFlow、 PyTorch、MXNet、XGBoost で使用可能) |
-
出力テンソルのデバッグ - トレーニングジョブの重み、勾配、バイアス、スカラー値などのモデルパラメータを追跡およびデバッグします。使用可能な深層学習フレームワークは、Apache MXNet 、 TensorFlow、 PyTorch、XGBoost です。
重要
Keras を使用する TensorFlow フレームワークの場合、 SageMaker Debugger は TensorFlow 2.6 以降の
tf.keras
モジュールを使用して構築されたモデルのデバッグに対するゼロコード変更サポートを廃止します。これは、TensorFlow 2.6.0 リリースノートで発表された重大な変更によるものです。トレーニングスクリプトを更新する手順については、「 TensorFlow トレーニングスクリプトを適応させる」を参照してください。 重要
PyTorch v1.12.0 以降、 SageMaker デバッガーはデバッグモデルのゼロコード変更サポートを廃止しました。
これは、 SageMaker デバッガーが
torch.jit
機能を妨げる重大な変更が原因です。トレーニングスクリプトを更新する手順については、「 PyTorch トレーニングスクリプトを適応させる」を参照してください。
トレーニングとデバッグを行うフレームワークまたはアルゴリズムが表にない場合は、 AWS ディスカッションフォーラム
AWS リージョン
Amazon SageMaker Debugger は、以下のリージョンを除く、Amazon SageMaker が稼働しているすべてのリージョンで使用できます。
アジアパシフィック (ジャカルタ):
ap-southeast-3
で Amazon SageMaker が稼働しているかどうかを確認するには AWS リージョン、「 AWS リージョン別のサービス
カスタムトレーニングコンテナと共にデバッガーを使用する
デバッガーを使ってトレーニングコンテナを に取り込み SageMaker 、トレーニングジョブに関するインサイトを得ることができます。モニタリングとデバッグの機能を使って Amazon EC2 インスタンスでモデルを最適化することで、作業効率を最大化します。
sagemaker-debugger
クライアントライブラリを使ってトレーニングコンテナを構築し、それを Amazon Elastic Container Registry (Amazon ECR) にプッシュし、モニタリングとデバッグを行う方法の詳細については、「カスタムトレーニングコンテナと共にデバッガーを使用する」を参照してください。
デバッガーオープンソース GitHub リポジトリ
デバッガー APIs は SageMaker Python SDK を通じて提供され、 および DescribeTrainingJob API オペレーションの SageMaker CreateTrainingJobデバッガーフックとルール設定を構築するように設計されています。sagemaker-debugger
クライアントライブラリは、フックを登録しトライアル機能を使ってトレーニングデータにアクセスするためのツールを、すべて柔軟で強力な API オペレーションを通じて提供します。Python 3.6 以降で機械学習フレームワーク TensorFlow PyTorch、MXNet 、XGBoost をサポートしています。
デバッガーと sagemaker-debugger
API オペレーションに関する直接のリソースについては、次のリンクを参照してください。
SDK for Java を使用して SageMaker トレーニングジョブを実行し、デバッガー APIsを設定する場合は、次のリファレンスを参照してください。