翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ライフサイクル設定をデバッグする
重要
2023 年 11 月 30 日現在、以前の Amazon SageMaker Studio エクスペリエンスは Amazon SageMaker Studio Classic という名前になりました。次のセクションは、Studio Classic アプリケーションの使用に固有のものです。更新された Studio エクスペリエンスの使用については、「」を参照してくださいAmazon SageMaker Studio。
次のトピックでは、ライフサイクル設定に関する情報を取得してデバッグする方法を説明します。
CloudWatch Logs からライフサイクル設定プロセスを検証する
ライフサイクル設定では STDOUT
と STDERR
のみを記録します。
STDOUT
は、bash スクリプトのデフォルト出力です。bash コマンドの最後に >&2
を追加することで、STDERR
に書き込むことができます。例えば、echo 'hello'>&2
と指定します。
ライフサイクル設定のログが に発行されます。 AWS アカウント Amazon を使用する CloudWatch。これらのログは、 CloudWatch コンソールの/aws/sagemaker/studio
ログストリームにあります。
で CloudWatch コンソールを開きますhttps://console.aws.amazon.com/cloudwatch/
。 左側で [ログ] を選択します。ドロップダウンメニューで、[ロググループ] を選択します。
[ロググループ] ページで、
aws/sagemaker/studio
を検索します。-
ロググループを選択します。
[ロググループの詳細] ページで、[ログストリーム] タブを選択します。
特定のアプリのログを検索するには、次の形式を使用してログストリームを検索します。
domain-id
/user-profile-name
/app-type
/app-name
例えば、ドメイン
d-m85lcu8vbqmz
、ユーザープロファイルi-sonic-js
、アプリケーションタイプJupyterServer
、アプリケーション名test-lcc-echo
のライフサイクル設定のログを検索するには、次の検索文字列を使用します。d-m85lcu8vbqmz/i-sonic-js/JupyterServer/test-lcc-echo
-
LifecycleConfigOnStart
で追加されたログストリームを選択して、スクリプト実行ログを表示します。
JupyterServer アプリの障害
アタッチされたライフサイクル設定の問題が原因で JupyterServer アプリケーションがクラッシュした場合、Studio Classic は Studio Classic の起動画面に次のエラーメッセージを表示します。
Failed to create SageMaker Studio due to start-up script failure
View script logs
リンクを選択すると、 JupyterServer アプリの CloudWatch ログが表示されます。
障害のあるライフサイクル設定がドメイン、ユーザープロファイル、または共有スペースDefaultResourceSpec
の で指定されている場合、Studio Classic は Studio Classic を再起動した後もライフサイクル設定を引き続き使用します。
このエラーを解決するには、「デフォルトのライフサイクル設定を設定する」の手順に従って DefaultResourceSpec
からライフサイクル設定スクリプトを削除するか、別のスクリプトをデフォルトに設定します。次に、新しい JupyterServer アプリを起動します。
KernelGateway アプリの障害
アタッチされたライフサイクル設定の問題が原因で KernelGateway アプリがクラッシュした場合、Studio Classic は Studio Classic ノートブックにエラーメッセージを表示します。
を選択して、アプリケーションの CloudWatch KernelGatewayログView script logs
を表示します。
この場合、ライフサイクル設定は、新しい Studio Classic ノートブックを起動するときに Studio Classic Launcher で指定されます。
このエラーを解決するには、Studio Classic ランチャーを使用して別のライフサイクル設定を選択するか、 を選択しますNo script
。
注記
で指定されたデフォルトの KernelGateway ライフサイクル設定は、ユーザーが Studio Classic ランチャーに表示されるリストから別のスクリプトを選択しない限り、ドメイン、ユーザープロファイル、または共有スペース内のすべての KernelGateway イメージDefaultResourceSpec
に適用されます。デフォルトのスクリプトは、ユーザーが [No Script
] (スクリプトなし) を選択した場合にも実行されます。スクリプトの選択については、「手順 3: ライフサイクル設定を使用してアプリケーションを起動する」を参照してください。
ライフサイクル設定のタイムアウト
ライフサイクル設定のタイムアウトの制限は 5 分です。ライフサイクル設定スクリプトの実行に 5 分以上かかる場合、Studio Classic はエラーをスローします。
このエラーを解決するには、ライフサイクル設定スクリプトが 5 分以内に完了するようにします。
スクリプトの実行時間を短縮できるように、次のことを試してください。
-
必要なステップを削減します。例えば、大きなパッケージをインストールする conda 環境を制限します。
-
並列プロセスでタスクを実行します。
-
スクリプトで
nohup
コマンドを使用して、ハングアップシグナルを無視し、スクリプトの実行が停止しないようにします。