翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
イメージ付きのトレーニングデータセットとテストデータセットの作成
1 つのデータセットを使用するプロジェクトから始めることも、個別のトレーニングデータセットとテストデータセットを持つプロジェクトから始めることもできます。1 つのデータセットから始めると、Amazon Rekognition Custom Labels はトレーニング中にデータセットを分割して、プロジェクトのトレーニングデータセット (80%) とテストデータセット (20%) を作成します。Amazon Rekognition Custom Labels にトレーニングとテストに使用するイメージを決定させる場合は、1 つのデータセットから始めてください。トレーニング、テスト、パフォーマンスのチューニングを完全に制御するには、トレーニングデータセットとテストデータセットを分けてプロジェクトを開始することをお勧めします。
以下のいずれかの場所からイメージをインポートすることにより、プロジェクトのトレーニングデータセットとテストデータセットを作成できます。
トレーニングデータセットとテストデータセットを分けてプロジェクトを開始する場合は、データセットごとに異なるソースの場所を使用できます。
イメージのインポート元によっては、イメージにラベルが付いていない場合があります。例えば、ローカルコンピュータからインポートされたイメージにはラベルは付きません。Amazon SageMaker Ground Truth マニフェストファイルからインポートされたイメージにはラベルが付けられます。Amazon Rekognition Custom Labels コンソールを使用して、ラベルの追加、変更、割り当てを行うことができます。詳細については、「イメージにラベルを付ける」を参照してください。
イメージのアップロード時にエラーが発生する、イメージが見つからない、イメージにラベルが付いていない場合は、「失敗したモデルトレーニングのデバッグ」を参照してください。
データセットの詳細については、「データセットの管理」を参照してください。
トレーニングデータセットとテストデータセットを作成する (SDK)
を使用して、 AWS SDKトレーニングデータセットとテストデータセットを作成できます。
CreateDataset
オペレーションでは、リソースを分類および管理するために、新しいデータセットの作成時にオプションでタグを指定できます。
トレーニングデータセット
を使用して、 AWS SDK次の方法でトレーニングデータセットを作成できます。
-
指定した Amazon Sagemaker 形式のマニフェストファイルCreateDatasetで を使用します。詳細については、「マニフェストファイルの作成」を参照してください。サンプルコードについては、「 SageMaker Ground Truth マニフェストファイルを使用したデータセットの作成 (SDK)」を参照してください。
-
CreateDataset
を使用して、既存の Amazon Rekognition Custom Labels データセットをコピーします。サンプルコードについては、「既存のデータセットを使用したデータセットの作成 (SDK)」を参照してください。 -
で空のデータセット
CreateDataset
を作成し、後で でデータセットエントリを追加しますUpdateDatasetEntries。空のデータセットを作成する方法については、「データセットをプロジェクトに追加する」を参照してください。データセットにイメージを追加する方法については、「イメージの追加 (SDK)」を参照してください。モデルをトレーニングする前に、データセットエントリを追加する必要があります。
テストデータセット
を使用して、 AWS SDK次の方法でテストデータセットを作成できます。
-
指定した Amazon Sagemaker 形式のマニフェストファイルCreateDatasetで を使用します。詳細については、「マニフェストファイルの作成」を参照してください。サンプルコードについては、「 SageMaker Ground Truth マニフェストファイルを使用したデータセットの作成 (SDK)」を参照してください。
-
CreateDataset
を使用して、既存の Amazon Rekognition Custom Labels データセットをコピーします。サンプルコードについては、「既存のデータセットを使用したデータセットの作成 (SDK)」を参照してください。 -
CreateDataset
で空のデータセットを作成し、後でUpdateDatasetEntries
でデータセットエントリを追加します。空のデータセットを作成する方法については、「データセットをプロジェクトに追加する」を参照してください。データセットにイメージを追加する方法については、「イメージの追加 (SDK)」を参照してください。モデルをトレーニングする前に、データセットエントリを追加する必要があります。 -
トレーニングデータセットとテストデータセットを分割します。まず、
CreateDataset
で空のテストデータセットを作成します。次に、 を呼び出して、トレーニングデータセットエントリの 20% をテストデータセットに移動しますDistributeDatasetEntries。空のデータセットを作成する方法については、「データセットをプロジェクトに追加する (SDK)」を参照してください。トレーニングデータセットを分割する方法については、「トレーニングデータセットの分散 (SDK)」を参照してください。