データ検証 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データ検証

モデルを構築する前に、SageMaker Canvas ではデータセットにビルド失敗の原因となる問題がないかをチェックします。SageMaker Canvas が問題を検出すると、モデルの構築前に [ビルド] ページに警告が表示されます。

データセットの問題のリストを表示するには、[データの検証] を選択します。その後、SageMaker Canvas の Data Wrangler データ準備機能または独自のツールを使用して、構築の開始前にデータセットを修正できます。データセットの問題を修正しない場合、モデルの構築は失敗します。

問題を解決するためにデータセットに変更を加えた場合は、構築する前にデータセットを再検証することができます。構築する前にデータセットを再検証することをお勧めします。

SageMaker Canvas がデータセットで確認する問題とその解決方法を次の表に示します。

問題 解決方法

データのモデルタイプが正しく有りません。

別のモデルタイプを試すか、別のデータセットを使用してください。

ターゲット列に値が不足しています。

欠損値を置き換えるか、欠損値のある行を削除するか、別のデータセットを使用してください。

対象列の固有ラベルが多すぎます。

ターゲット列に正しい列を使用していることを確認するか、別のデータセットを使用してください。

ターゲット列に数値以外の値が多すぎます。

別のターゲット列を選択するか、別のモデルタイプを選択するか、別のデータセットを使用してください。

1 つ以上の列名に二重のアンダースコアが含まれています

列の名前を変更して二重のアンダースコアを削除し、もう一度試します。

データセットのすべての行に欠損値があります。

欠損値を置き換えるか、別のデータセットを使用してください。

データの行数に対して固有ラベルが多すぎます。

正しいターゲット列を使用していることを確認するか、データセットの行数を増やすか、類似のラベルを統合するか、別のデータセットを使用してください。