ライフサイクル設定をデバッグする - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ライフサイクル設定をデバッグする

次のトピックでは、ライフサイクル設定に関する情報を取得してデバッグする方法を説明します。

CloudWatch Logs からライフサイクル設定プロセスを検証する

ライフサイクル設定では STDOUTSTDERR のみを記録します。

STDOUT は、bash スクリプトのデフォルト出力です。bash コマンドの最後に >&2 を追加することで、STDERR に書き込むことができます。例えば echo 'hello'>&2 です。

ライフサイクル設定のログは、Amazon AWS アカウント を使用して に発行されます CloudWatch。これらのログは、 CloudWatch コンソールの/aws/sagemaker/studioログストリームにあります。

  1. https://console.aws.amazon.com/cloudwatch/ で CloudWatch コンソールを開きます。

  2. 左側のナビゲーションペインからログを選択します。ドロップダウンメニューで、[ロググループ] を選択します。

  3. [ロググループ] ページで、aws/sagemaker/studio を検索します。

  4. ロググループを選択します。

  5. [ロググループの詳細] ページで、[ログストリーム] タブを選択します。

  6. 特定のアプリのログを検索するには、次の形式を使用してログストリームを検索します。

    domain-id/user-profile-name/app-type/app-name

    次の検索文字列は、ドメイン d-m85lcu8vbqmz、ユーザープロファイル i-sonic-js、アプリケーションタイプ JupyterLab、およびアプリケーション名 のライフサイクル設定ログを検索しますtest-lcc-echo

    d-m85lcu8vbqmz/i-sonic-js/JupyterLab/test-lcc-echo
  7. スクリプト実行ログを表示するには、 が追加されたログストリームを選択しますLifecycleConfigOnStart

ライフサイクル設定のタイムアウト

ライフサイクル設定のタイムアウトの制限は 5 分です。ライフサイクル設定スクリプトの実行に 5 分以上かかる場合は、 エラーが発生します。

このエラーを解決するには、ライフサイクル設定スクリプトが 5 分以内に完了することを確認してください。

スクリプトの実行時間を短縮するには、以下を試してください。

  • 不要なステップを減らします。例えば、大きなパッケージをインストールする conda 環境を制限します。

  • 並列プロセスでタスクを実行します。

  • スクリプトで nohup コマンドを使用して、スクリプトが停止せずに実行されるようにハングアップシグナルが無視されるようにします。