トラブルシューティングガイド - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

トラブルシューティングガイド

このトラブルシューティングガイドを参照すると、スケジュール済みノートブックジョブの実行時に発生する可能性のある障害をデバッグするのに役立ちます。

ジョブ定義でジョブが作成されない

ジョブ定義によってジョブが開始されない場合は、以下の原因が考えられます。

アクセス許可がない

  • ジョブ定義に割り当てられたロールには、Amazon との信頼関係がありません EventBridge。つまり、ロールを引き受け EventBridge ることはできません。

  • ジョブ定義に割り当てられたロールには、SageMaker:StartPipelineExecution を呼び出すアクセス許可がありません。

  • ジョブ定義に割り当てられたロールには、SageMaker:CreateTrainingJob を呼び出すアクセス許可がありません。

EventBridge クォータの超過

次の例のようなPut*エラーが表示された場合は、クォータを超えました EventBridge。これを解決するには、未使用の EventBridge 実行をクリーンアップするか、 AWS Support にクォータの引き上げを依頼します。

LimitExceededException) when calling the PutRule operation: The requested resource exceeds the maximum number allowed

EventBridge クォータの詳細については、「Amazon EventBridge クォータ」を参照してください。

パイプラインのクォータ制限を超過

次の例のようなエラーが表示される場合は、実行できるパイプラインの数を超過しています。この問題を解決するには、アカウント内の未使用のパイプラインをクリーンアップするか、割り当てを増やすよう AWS Support に依頼します。

ResourceLimitExceeded: The account-level service limit 'Maximum number of pipelines allowed per account' is XXX Pipelines, with current utilization of XXX Pipelines and a request delta of 1 Pipelines.

パイプラインクォータの詳細については、「Amazon SageMaker エンドポイントとクォータ」を参照してください。

トレーニングジョブの制限を超過

次の例のようなエラーが表示される場合は、実行できるトレーニングジョブの数を超過しています。これを解決するには、アカウント内のトレーニングジョブの数を減らすか、 AWS Support にクォータの引き上げを依頼してください。

ResourceLimitExceeded: The account-level service limit 'ml.m5.2xlarge for training job usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances. Please contact AWS support to request an increase for this limit.

トレーニングジョブクォータの詳細については、「Amazon SageMaker エンドポイントとクォータ」を参照してください。

SparkMagic ノートブックで自動視覚化が無効になっている

ノートブックが SparkMagic PySpark カーネルを使用していて、ノートブックをノートブックジョブとして実行している場合、出力で自動視覚化が無効になっていることがあります。自動視覚化を有効にするとカーネルがハングするため、ノートブックジョブエグゼキュターは現在、回避策として自動視覚化を無効にします。