失敗したモデルトレーニングのデバッグ - Rekognition

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

失敗したモデルトレーニングのデバッグ

モデルトレーニング中にエラーが発生する場合があります。Amazon Rekognition Custom Labels は、コンソールと からのレスポンスでトレーニングエラーを報告しますDescribeProjectVersions

エラーは、ターミナル (トレーニングを継続できない) か、非ターミナル (トレーニングを継続できる) かのいずれかです。トレーニングデータセットとテストデータセットのコンテンツに関連するエラーについては、検証結果 (マニフェストの概要トレーニングとテストの検証マニフェスト) をダウンロードできます。検証結果のエラーコードを使用して、このセクションの詳細情報を確認してください。このセクションには、マニフェストファイルエラー (マニフェストファイルの内容が検証される前に発生するターミナルエラー) に関する情報も記載されています。

注記

マニフェストは、データセットのコンテンツを保存するために使用されるファイルです。

一部のエラーは、Amazon Rekognition Custom Labels コンソールを使用して修正できます。そのほかのエラーでは、トレーニングマニフェストファイルまたはテストマニフェストファイルの更新が必要となる場合があります。アクセスIAM許可など、他の変更が必要になる場合があります。詳細については、個々のエラーのドキュメントを参照してください。

ターミナルエラー

ターミナルエラーが発生すると、モデルのトレーニングが停止します。ターミナルトレーニングエラーには、サービスエラー、マニフェストファイルエラー、マニフェストコンテンツエラーの 3 つのカテゴリがあります。

コンソールの Amazon Rekognition Custom Labels のプロジェクトページの [ステータスメッセージ] 列には、モデルのターミナルエラーが表示されます。プロジェクト管理ダッシュボードには、名前、バージョン、作成日、モデルのパフォーマンス、トレーニングの完了や失敗などのモデルの状態を示すステータスメッセージを含むプロジェクトのリストが表示されます。

プロジェクト管理ダッシュボードのスクリーンショット。

を使用している場合は AWS SDK、 からのレスポンスをチェックすることで、ターミナルマニフェストファイルエラーまたはターミナルマニフェストコンテンツエラーが発生したかどうかを確認できますDescribeProjectVersions。この場合、Status 値は TRAINING_FAILED で、StatusMessage フィールドにはエラーが含まれています。

サービスエラー

ターミナルサービスエラーは、Amazon Rekognition でサービスの問題が発生し、トレーニングを継続できない場合に発生します。例えば、Amazon Rekognition Custom Labels が依存する別のサービスの障害などです。Amazon Rekognition でサービスの問題が発生したため、Amazon Rekognition Custom Labels は、コンソールにサービスエラーを報告します。を使用する場合 AWS SDK、トレーニング中に発生するサービスエラーは、 CreateProjectVersionおよび によってInternalServerError例外として発生しますDescribeProjectVersions

サービスエラーが発生した場合は、モデルのトレーニングを再試行してください。トレーニングが引き続き失敗する場合は、 AWS サポートに連絡し、サービスエラーで報告されたエラー情報を含めます。

ターミナルマニフェストファイルエラーのリスト

マニフェストファイルエラーは、トレーニングデータセットとテストデータセット内の、ファイルレベルまたは複数のファイルにまたがって発生するターミナルエラーです。マニフェストファイルエラーは、トレーニングデータセットとテストデータセットの内容が検証される前に検出されます。マニフェストファイルエラーが発生すると、非ターミナルの検証エラーは報告されません。例えば、トレーニングマニフェストファイルが空の場合、マニフェストファイルは空ですというエラーが生成されます。ファイルは空であるため、非ターミナルJSONライン検証エラーは報告できません。マニフェストの概要も作成されません。

モデルをトレーニングする前に、マニフェストファイルエラーを修正する必要があります。

マニフェストファイルエラーを以下に示します。

ターミナルマニフェストコンテンツエラーのリスト

マニフェストコンテンツエラーは、マニフェスト内のコンテンツに関連するターミナルエラーです。例えば、このマニフェストファイルには、自動分割を実行するには不十分なラベル付きイメージが含まれていますというエラーが表示された場合は、トレーニングデータセットにはテストデータセットを作成するのに十分な数のラベル付きイメージがないため、トレーニングを終了できません。

このエラーは、コンソールおよび DescribeProjectVersions からの応答で報告されるだけでなく、他のターミナルマニフェストコンテンツエラーとともにマニフェストの概要でも報告されます。詳細については、「マニフェストの概要について」を参照してください。

ターミナル以外のJSON行エラーは、個別のトレーニングとテストの検証結果マニフェストでも報告されます。Amazon Rekognition Custom Labels で見つかった非ターミナルJSONラインエラーは、トレーニングを停止するマニフェストコンテンツエラー (複数可) に必ずしも関連しているわけではありません。詳細については、「トレーニングとテストの検証結果マニフェストを理解する」を参照してください。

モデルをトレーニングする前に、マニフェストコンテンツエラーを修正する必要があります。

マニフェストコンテンツエラーのエラーメッセージは次のとおりです。

非ターミナルJSONライン検証エラーのリスト

JSON ライン検証エラーは、Amazon Rekognition Custom Labels がモデルのトレーニングを停止する必要がない非ターミナルエラーです。

JSON ライン検証エラーはコンソールに表示されません。

トレーニングデータセットとテストデータセットでは、JSON行は 1 つのイメージのトレーニングまたはテスト情報を表します。無効なイメージなどのJSON行の検証エラーは、トレーニングおよびテストの検証マニフェストで報告されます。Amazon Rekognition Custom Labels は、マニフェスト内の他の有効なJSON行を使用してトレーニングを完了します。詳細については、「トレーニングとテストの検証結果マニフェストを理解する」を参照してください。検証ルールの詳細については、「マニフェストファイルの検証ルール」を参照してください。

注記

JSON 行エラーが多すぎると、トレーニングは失敗します。

また、将来のエラーやモデルトレーニングに影響する可能性があるため、非ターミナルJSONラインエラーも修正することをお勧めします。

Amazon Rekognition Custom Labels では、次の非ターミナルJSONライン検証エラーが発生する可能性があります。