Amazon SageMaker Profiler - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker Profiler

Amazon SageMaker Profiler は現在プレビューリリース中で、サポートされている AWS リージョンでは無料でご利用いただけます。Amazon SageMaker Profiler の一般公開バージョン (ある場合) には、プレビューで提供されるものとは異なる機能や価格が含まれている場合があります。

Amazon SageMaker Profiler は Amazon SageMaker AI の一機能であり、SageMaker AI での深層学習モデルのトレーニング中にプロビジョニングされたコンピューティングリソースを AWS 詳細に把握できます。CPU と GPU の使用状況、GPU でのカーネル実行、CPU でのカーネル起動、同期オペレーション、CPU と GPU 間のメモリ内のオペレーション、カーネル起動とそれに対応する実行の間のレイテンシー、CPU と GPU 間のデータ転送のプロファイリングに重点を置いています。SageMaker Profiler には、GPU と CPU 間のイベントの時間関係を追跡して理解するためのプロファイル、プロファイルされたイベントの統計サマリー、トレーニングジョブのタイムラインを視覚化するユーザーインターフェイス (UI) も用意されています。

注記

SageMaker Profiler は PyTorch と TensorFlow をサポートしており、AWS SageMaker AI 用の深層学習コンテナで利用できます。詳細については、「サポートされているフレームワークイメージ、 AWS リージョン、インスタンスタイプ」を参照してください。

データサイエンティスト向け

大規模なコンピューティングクラスターで深層学習モデルをトレーニングすると、ボトルネック、カーネル起動レイテンシー、メモリ制限、リソース使用率の低下など、計算最適化の問題が発生することがよくあります。

このような計算パフォーマンスの問題を特定するには、コンピューティングリソースを詳細に分析して、どのカーネルがレイテンシーを発生させ、どのオペレーションがボトルネックの原因となっているかを理解する必要があります。データサイエンティストは、SageMaker Profiler UI を使用してトレーニングジョブの詳細なプロファイルを視覚化することができます。UI は、要約グラフとコンピューティングリソース上のすべてのイベントを追跡するためのタイムラインインターフェースを備えたダッシュボードを提供します。データサイエンティストは、SageMaker Profiler Python モジュールを使用してトレーニングジョブの特定の部分を追跡するためのカスタム注釈を追加することもできます。

管理者向け

SageMaker AI コンソールまたは SageMaker AI ドメインの Profiler ランディングページから、 AWS アカウントまたは SageMaker AI ドメインの管理者であれば、Profiler アプリケーションユーザーを管理できます。各ドメインユーザーは、付与されたアクセス許可を使用して自分の Profiler アプリケーションにアクセスできます。SageMaker AI ドメイン管理者およびドメインユーザーは、持っているアクセス許可レベルに応じて Profiler アプリケーションを作成および削除できます。