データセットを作成する - Amazon Lookout for Vision

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データセットを作成する

データセットには、モデルのトレーニングとテストに使用する画像と割り当てられたラベルが含まれています。プロジェクトのデータセットは、Amazon Lookout for Vision CreateDatasetコンソールまたはオペレーションを使用して作成します。データセットの画像には、作成するモデルのタイプ (画像分類または画像セグメンテーション) に従ってラベルを付ける必要があります。

データセットの画像の準備

データセットを作成するには、画像のコレクションが必要です。画像は PNG または JPEG 形式のファイルである必要があります。

単一のデータセットプロジェクトを使用している場合、トレーニングを開始するには次のものが必要です。

  • 通常のオブジェクトの画像が少なくとも20枚。

  • 異常な物体の画像が10枚以上。

  • 画像セグメンテーションモデルでは、各異常タイプの画像が少なくとも 20 個必要です。これらの各画像には、1 種類の異常のみが含まれている必要があります。

個別のトレーニングデータセットとテストデータセットを使用している場合は、トレーニングを開始するには次のものが必要です。

  • トレーニングデータセット内の通常のオブジェクトの画像が少なくとも10枚。

  • テストデータセットには、少なくとも 10 枚の正常なオブジェクトの画像、少なくとも 10 枚の異常なオブジェクトの画像があります。

  • セグメンテーションモデルを作成する場合、各データセットには、各異常タイプの画像が少なくとも 10 枚必要です。これらの各画像には、1 種類の異常のみが含まれている必要があります。

より高品質なモデルを作成するには、最小画像数より多くの画像を使用してください。セグメンテーションモデルを作成する場合、複数の異常タイプを含む画像を含めることをお勧めしますが、これらは Lookout for Vision がトレーニングを開始するために必要とする最小値にはカウントされません。

画像は単一のタイプのオブジェクトのものである必要があります。また、カメラの位置、ライティング、オブジェクトのポーズなど、画像の撮影条件を統一しておく必要があります。

プロジェクト内のすべての画像の寸法が同じである必要があります。

トレーニング画像とテスト画像はすべて固有の画像でなければならず、できれば固有のオブジェクトの画像であることが望まれます。正常な画像は、分析対象のオブジェクトにありえる正常な範囲のバリエーションを含んでいる必要があります。異常な画像では、さまざまな異常のサンプルをとらえている必要があります。

Amazon Lookout for Vision では、使用できるサンプル画像を提供しています。詳細については、「画像分類」を参照してください。

画像の制限については、「Amazon Lookout for Vision でのクォータ」を参照してください。

データセットの作成

プロジェクトのデータセットを作成するときは、プロジェクトの初期データセット構成を選択します。また、Lookout for Vision が画像をインポートする場所も選択できます。

プロジェクトのデータセット構成の選択

プロジェクトで最初のデータセットを作成するときは、次のデータセット構成のいずれかを選択します。

  • シングルデータセット — シングルデータセットプロジェクトは、単一のデータセットを使用して、モデルのトレーニングとテストを行います。単一のデータセットを使用することで、Amazon Lookout for Visionがトレーニング画像とテスト画像を選択し、トレーニングを簡素化することができます。す。トレーニング中、Amazon Lookout for Vision では、データセットをトレーニングデータセットとテストデータセットに分割します。分割されたデータセットにはアクセスできません。ほとんどのシナリオでは、シングルデータセットプロジェクトを使用することをお勧めします。

  • トレーニングデータセットとテストデータセットを分離する — トレーニング、テスト、パフォーマンスチューニングをより細かく制御したい場合は、トレーニングデータセットとテストデータセットを別々に持つようにプロジェクトを構成することができます。テストに使用する画像をコントロールしたい場合、または既に使用したいベンチマーク画像セットがある場合は、別のテストデータセットを使用します。

テストデータセットは、既存のシングルデータセットプロジェクトに追加できます。これにより、シングルデータセットがトレーニングデータセットになります。トレーニングデータセットとテストデータセットが別々に存在するプロジェクトからテストデータセットを削除すると、そのプロジェクトはシングルデータセットのプロジェクトになります。詳細については、「データセットの削除」を参照してください。

イメージのインポート

データセットを作成するときは、画像をインポートする場所を選択します。画像のインポート方法によっては、画像にすでにラベルが付けられている場合があります。データセットの作成後に画像にラベルが付いていない場合は、を参照してください画像にラベルを付ける

データセットを作成し、次のいずれかの方法でデータセット画像をインポートします。

  • ローカルコンピュータから画像をインポートします。画像にはラベルが付いていません。Lookout for Vision コンソールを使用して追加またはラベル付けを行います。

  • S3 バケットから画像をインポートします。Amazon Lookout for Vision では、フォルダー名を使用して画像を分類できます。normal通常の画像に使用します。anomaly異常な画像に使用します。セグメンテーションラベルを自動的に割り当てることはできません。

  • ラベル付きの画像を含む Amazon SageMaker Ground Truth マニフェストファイルをインポートします。独自のマニフェストファイルを作成してインポートできます。画像が多い場合は、 SageMaker Ground Truth ラベリングサービスの使用を検討してください。次に、Amazon SageMaker Ground Truth ジョブから出力マニフェストファイルをインポートします。必要に応じて、Lookout for Vision コンソールを使用してラベルを追加または変更できます。

AWSSDK を使用している場合は、Amazon SageMaker Ground Truth マニフェストファイルを使用してデータセットを作成します。詳細については、「Amazon SageMaker Ground Truth マニフェストファイルを使用してデータセットを作成する」を参照してください。

データセットを作成した後に画像にラベルが付けられれば、モデルをトレーニングできます。画像にラベルが付いていない場合は、作成するモデルのタイプに応じてラベルを追加してください。詳細については、「画像にラベルを付ける」を参照してください。

既存のデータセットに画像を追加できます。詳細については、「データセットへの画像の追加」を参照してください。