トラブルシューティング - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

トラブルシューティング

Amazon SageMaker AI バッチ変換でエラーが発生する場合は、以下のトラブルシューティングのヒントを参照してください。

最大タイムアウトエラー

バッチ変換ジョブの実行時に最大タイムアウトエラーが発生する場合は、以下を試してください。

  • まず、単一レコード BatchStrategyMaxPayloadInMB パラメータで指定したデフォルト (6 MB) 以下のバッチサイズ、および小さなサンプルデータセットから開始します。呼び出しの応答が成功するまで、最大タイムアウトパラメータ InvocationsTimeoutInSeconds (最大 1 時間) を調整します。

  • 呼び出しレスポンスを正常に受信したら、MaxPayloadInMB (最大 100 MB) InvocationsTimeoutInSeconds とパラメータを増やし、希望するモデルのタイムアウトに対応できる最大バッチサイズを見つけます。このステップでは、単一レコードまたはマルチレコード BatchStrategy のいずれかを使用できます。

    注記

    MaxPayloadInMB 制限を超過すると、エラーになります。このエラーは、分割できない場合、SplitType パラメータが「なし」に設定されている場合、またはデータセット内の個々のレコードが制限を超えている場合に大規模なデータセットで発生する可能性があります。

  • (オプション) バッチ変換ジョブの各インスタンスに送信できる並列リクエストの最大数を指定する MaxConcurrentTransforms パラメータを調整します。ただし、MaxConcurrentTransforms * MaxPayloadInMB の値は 100 MB 以下にする必要があります。

不完全な出力

SageMaker AI は、Amazon S3 のマルチパートアップロード API を使用して、バッチ変換ジョブの結果を Amazon S3 にアップロードします。エラーが発生すると、アップロードした結果が Amazon S3 から削除されます。ネットワーク停止が発生するなどの状況では、不完全なマルチパートアップロードが Amazon S3 に残ることがあります。入力ファイルが複数あり、一部のファイルが SageMaker AI バッチ変換で処理できない場合にも、不完全なアップロードが発生することがあります。Amazon S3 には、処理できなかった入力ファイルに対応する出力ファイルはありません。

ストレージ料金が発生しないように、S3 バケットライフサイクルルールに S3 バケットポリシーを追加することをお勧めします。このポリシーは、S3 バケットに保存されている可能性がある不完全なマルチパートアップロードを削除します。詳細については、「オブジェクトのライフサイクル管理」を参照してください。

ジョブは failed として表示されます。

データセットに問題があるためにバッチ変換ジョブが入力ファイルの処理に失敗すると、SageMaker AI はジョブを failed とマークします。入力ファイルに不正なレコードが含まれている場合は、入力ファイルと同じ順番を変換済みデータで維持できないため、この入力ファイルの出力ファイルは変換ジョブで作成されません。データセットに複数の入力ファイルが含まれている場合は、1 つの入力ファイルの処理に失敗しても、変換ジョブは入力ファイルの処理を続行します。処理済みのファイルからは依然として使用可能な結果が生成されます。

独自のアルゴリズムを使用している場合、このアルゴリズムは、入力ファイル内に不正なレコードを見つけると、ERROR などのプレースホルダーテキストを使用できます。たとえば、データセット内の最終レコードが不正である場合、アルゴリズムは、そのレコードのプレースホルダーテキストを出力ファイル内に配置します。