Amazon SageMaker スタジオクラシックのトラブルシューティング - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker スタジオクラシックのトラブルシューティング

重要

2023 年 11 月 30 日の時点で、以前の Amazon SageMaker Studio エクスペリエンスは Amazon SageMaker スタジオクラシックという名前になりました。以下のセクションは Studio Classic アプリケーションの使用に特化したものです。最新の Studio エクスペリエンスの使用方法については、を参照してくださいAmazon SageMaker Studio

このトピックでは、セットアップおよび使用中によくある Amazon SageMaker Studio Classic の問題をトラブルシューティングする方法について説明します。Amazon SageMaker Studio クラシックの使用中に発生する可能性のある一般的なエラーは次のとおりです。各エラーの後に、エラーの解決策を示します。

Studio Classic アプリケーションに関する問題

Studio Classic アプリケーションを起動して使用すると、次の問題が発生します。

  • 画面が読み込まれない: ワークスペースをクリアして待機しても問題が解消されない

    Studio Classic アプリケーションを起動すると、ポップアップに次のメッセージが表示されます。どのオプションを選択しても Studio Classic は読み込まれません。

    Loading... The loading screen is taking a long time. Would you like to clear the workspace or keep waiting?

    Studio Classic ワークスペースで複数のタブが開いている場合や、Amazon EFS に複数のファイルがある場合、Studio Classic アプリケーションの起動が遅れることがあります。Studio Classic ワークスペースの準備が整うと、このポップアップは数秒で消えます。

    いずれかのオプションを選択してもスピナー付きのロード画面が引き続き表示される場合は、Studio Classic で使用されている Amazon Virtual Private Cloud との接続に問題がある可能性があります。 

    Studio Classic で使用されている Amazon Virtual Private Cloud (Amazon VPC) との接続問題を解決するには、以下のネットワーク構成を確認してください。

    • VpcOnlyドメインがモードで設定されている場合: AWS STSインターネット経由のトラフィックを含むアウトバウンドトラフィック用の Amazon VPC エンドポイントまたは NAT ゲートウェイがあることを確認します。確認するには、「VPC 内の SageMaker Studio ノートブックを外部リソースConnect する」の手順に従います。

    • Amazon VPC が Amazon が提供する DNS ではなくカスタム DNS で設定されている場合:Studio Classic が使用する Amazon VPC に追加された各 Amazon VPC エンドポイントについて、動的ホスト構成プロトコル (DHCP) を使用してルートが設定されていることを確認します。DHCP のデフォルトおよびカスタムオプションセットの設定の詳細については、「DHCP option sets in Amazon VPC」を参照してください。

  • Studio Classic の起動時に内部障害が発生しました

    Studio Classic を起動すると、スタジオクラシック UI を表示できなくなります。また、次のようなエラーが表示され、エラーの詳細が内部障害になっています。

    Amazon SageMaker Studio The JupyterServer app default encountered a problem and was stopped.

    このエラーは複数の要因によって発生する可能性があります。これらの手順を実行しても問題が解決しない場合は、https://aws.amazon.com/premiumsupport/ でサポートを依頼してください。 

    • Amazon EFS マウントターゲットが見つかりません:スタジオクラシックはストレージに Amazon EFS を使用しています。Amazon EFS ボリュームには、Amazon SageMaker ドメインが作成されるサブネットごとにマウントターゲットが必要です。この Amazon EFS マウントターゲットを誤って削除した場合、Studio Classic アプリケーションはユーザーのファイルディレクトリをマウントできないため、ロードできません。この問題を解決するには、次の手順に従います。

      マウントターゲットを検証または作成するには
      1. DescribeDomainAPI 呼び出しを使用して、ドメインに関連付けられている Amazon EFS ボリュームを検索します。 

      2. AWS Management Console にサインインし、https://console.aws.amazon.com/efs/ にある Amazon EFS コンソールを開きます。

      3. Amazon EFS ボリュームのリストから、ドメインに関連付けられている Amazon EFS ボリュームを選択します。

      4. Amazon EFS の詳細ページで、[ネットワーク] タブを選択します。ドメインが設定されているすべてのサブネットにマウントターゲットがあることを確認します。

      5. マウントターゲットがない場合は、Amazon EFS マウントターゲットを追加します。手順については、「Creating and managing mount targets and security groups」を参照してください。

      6. 見つからないマウントターゲットが作成されたら、Studio Classic アプリケーションを起動します。

    • .localユーザーのフォルダー内の競合ファイル:Studio Classic JupyterLab でバージョン 1 を使用している場合、.localフォルダー内の競合するライブラリが Studio Classic アプリケーションを起動する際に問題を引き起こす可能性があります。この問題を解決するには、 JupyterLab ユーザープロファイルのデフォルトバージョンを 3.0 JupyterLab に更新してください。 JupyterLab バージョンの表示と更新の詳細については、を参照してくださいJupyterLab バージョニング

  • ConfigurationError: Studio Classic LifecycleConfig を起動するとき

    スタジオクラシックを起動しても、スタジオクラシック UI は表示されません。これは、ドメインにアタッチされているデフォルトのライフサイクル設定スクリプトに問題があることが原因です。

    ライフサイクル設定の問題を解決するには
    1. ライフサイクル設定の Amazon CloudWatch Logs を表示して、障害の原因となったコマンドを追跡します。ログを表示するには、「 CloudWatch ライフサイクル設定プロセスをログから検証します。」の手順に従います。

    2. デフォルトのスクリプトをユーザープロファイルまたはドメインからデタッチします。詳細については、「ライフサイクル設定の更新とデタッチ」を参照してください。

    3. Studio Classic アプリケーションを起動します。

    4. ライフサイクル設定スクリプトをデバッグします。システムターミナルからライフサイクル設定スクリプトを実行することで、トラブルシューティングできます。スクリプトがターミナルから正常に実行されたら、ユーザープロファイルまたはドメインにスクリプトをアタッチできます。

  • SageMaker Studio Classic のコア機能は使用できません。

    Studio Classic を開いたときにこのエラーメッセージが表示される場合は、Python パッケージのバージョンが競合していることが原因である可能性があります。これは、ノートブックまたはターミナルで次のコマンドを使用して、パッケージの依存関係とバージョンが競合する Python SageMaker パッケージをインストールした場合に発生します。

    !pip install
    pip install --user

    この問題を解決するには、次の手順に従います。

    1. 最近インストールした Python パッケージをアンインストールします。どのパッケージをアンインストールすればよいかわからない場合は、https://aws.amazon.com/premiumsupport/ でサポートを依頼してください。 

    2. Studio クラシックを再起動します。

      1. [ファイル] メニューから Studio クラシックをシャットダウンします。

      2. 1 分間待ちます。

      3. ページを更新するか、から開いて Studio Classic を再度開きます。 AWS Management Console

    競合の原因となったパッケージをアンインストールすると、問題は解決します。この問題を再度発生させないようにパッケージをインストールするには、--user フラグを付けずに %pip install を実行します。

    問題が解決しない場合、新しいユーザープロファイルを作成し、そのユーザープロファイルを使って環境を設定します。

    これらの解決策で問題が解決しない場合は、https://aws.amazon.com/premiumsupport/ でサポートを依頼してください。 

  • から Studio Classic を開くことができません。 AWS Management Console

    Studio Classic を開くことができず、すべてのデフォルト設定で実行中のインスタンスを新たに作成できない場合は、https://aws.amazon.com/premiumsupport/ で問題を作成してください。 

KernelGateway アプリケーションに関する問題

以下の問題は Studio Classic KernelGateway で起動するアプリケーションに固有の問題です。

  • カーネルセッションにアクセスできない

    ユーザーが新しいノートブックを起動しても、ノートブックセッションに接続できません。 KernelGateway アプリケーションのステータスがの場合In Service、以下を確認して問題を解決できます。

    • セキュリティグループの設定を確認する

      VPCOnlyドメインがモードに設定されている場合、ドメインに関連付けられているセキュリティグループは、8192-65535 JupyterServer KernelGateway とアプリ間の接続のために、範囲内のポート間のトラフィックを許可する必要があります。

      セキュリティグループのルールを確認するには
      1. DescribeDomainAPI 呼び出しを使用して、ドメインに関連付けられているセキュリティグループを取得します。

      2. AWS Management Console にサインインし、https://console.aws.amazon.com/vpc/ にある Amazon VPC コンソールを開きます。

      3. 左側のナビゲーションの [セキュリティ] で、[セキュリティグループ] を選択します。

      4. ドメインに関連付けられているセキュリティグループの ID でフィルタリングします。

      5. 各セキュリティグループで次を実行します。

        1. セキュリティグループを選択します。

        2. セキュリティグループの詳細ページで、[インバウンドルール] を表示します。8192-65535 の範囲内のポート間で、トラフィックが許可されていることを確認します。

      セキュリティグループのルールの詳細については、「Control traffic to resources using security groups」を参照してください。Studio Classic VPCOnly をモードで使用するための要件の詳細については、を参照してくださいVPC 内の SageMaker Studio ノートブックを外部リソースConnect する

    • WebSocketファイアウォールと接続を確認してください。

      KernelGateway InServiceアプリにステータスがあり、ユーザーが Studio Classic ノートブックセッションに接続できない場合は、WebSocket ファイアウォールと設定を確認してください。

      1. Studio Classic アプリケーションを起動します。詳細については、「Amazon SageMaker スタジオクラシックを起動」を参照してください。

      2. ウェブブラウザの開発者ツールを開きます。

      3. [ネットワーク] タブを選択します。

      4. 次の形式に一致するエントリを検索します。

        wss://<domain-id>.studio.<region>.sagemaker.aws/jupyter/default/api/kernels/<unique-code>/channels?session_id=<unique-code>

        エントリのステータスコードまたはレスポンスコードがそれ以外の場合は101、ネットワーク設定により Studio Classic KernelGateway アプリケーションとアプリ間の接続が妨げられています。

        この問題を解決するには、ネットワーク設定を管理するチームに連絡して、Studio Classic URL を許可リストに追加し、 WebSocket 接続を有効にしてもらってください。 

  • リソースクォータの超過によりアプリを起動できない

    ユーザーが新しいノートブックを起動しようとすると、ノートブックの作成が以下のいずれかのエラーで失敗します。これはリソースクォータの超過が原因です。

    • Unable to start more Apps of AppType [KernelGateway] and ResourceSpec(instanceType=[]) for UserProfile []. Please delete an App with a matching AppType and ResourceSpec, then try again

      Studio Classic は、同じインスタンス上で最大 4 KernelGateway つの実行中のアプリをサポートします。この問題を解決するには、次のいずれかを実行します。

      • KernelGateway インスタンスで実行されている既存のアプリケーションを削除し、新しいノートブックを再起動します。

      • 新しいノートブックを別のインスタンスタイプで起動します。

      詳細については、「インスタンスタイプの変更」を参照してください。

    • An error occurred (ResourceLimitExceeded) when calling the CreateApp operation

      この場合、アカウントには指定されたインスタンスタイプで Studio Classic アプリケーションを作成するための十分な制限がありません。この問題を解決するには、https://console.aws.amazon.com/servicequotas/ Service Quotas のコンソールにアクセスしてください。コンソールで、Studio KernelGateway Apps running on instance-type instance 制限の引き上げをリクエストします。詳細については、AWS Service Quotas を参照してください。