データセットの目的の設定 - Rekognition

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データセットの目的の設定

プロジェクト内のトレーニングデータセットとテストデータセットにどのようにラベルを付けるかによって、作成するモデルのタイプが決まります。Amazon Rekognition Custom Labels を使用すると、次のことが実行するモデルを作成できます。

オブジェクト、シーン、概念を検出する

モデルによって、イメージ全体に関連付けられているオブジェクト、シーン、概念を分類します。

イメージ分類マルチラベル分類の 2 つのタイプの分類モデルを作成できます。どちらのタイプの分類モデルでも、モデルはトレーニングに使用されたラベルのセット全体から一致するラベルを検索します。トレーニングデータセットとテストデータセットで、どちらも最低 2 つのラベルが必要です。

画像分類

このモデルは、イメージを事前定義済みのラベルのセットに帰属するものとして分類します。例えば、イメージに居住スペースが含まれているかどうかを判断するモデルが必要な場合があります。次のイメージには living_space のイメージレベルのラベルが付いている場合があります。

家具付きのリビングルーム、家具付きの広い窓、裏庭の空間。ニュートラルトーン、アクセント。

このタイプのモデルでは、トレーニングデータセットとテストデータセットのイメージに、イメージレベルのラベルをそれぞれ 1 つ追加します。サンプルプロジェクトについては、「画像分類」を参照してください。

マルチラベル分類

このモデルは、花の種類や葉の有無など、イメージを複数のカテゴリに分類します。例えば、次のイメージには mediterranean_spurgeno_leaves のイメージレベルのラベルが付いている可能性があります。

小さなフローレットが密集した緑色のバイバーナム花クラスターのクローズアップ。

このタイプのモデルでは、トレーニングデータセットとテストデータセットのイメージに、各カテゴリの画像レベルのラベルを割り当てます。サンプルプロジェクトについては、「マルチラベルイメージ分類」を参照してください。

イメージレベルのラベルの割り当て

イメージが Amazon S3 バケットに保存されている場合は、フォルダ名を使用すればイメージレベルのラベルを自動的に追加できます。詳細については、「Amazon S3 バケットからのイメージのインポート」を参照してください。また、データセットを作成した後で、イメージにイメージレベルのラベルを追加できます。詳細については、「イメージにイメージレベルのラベルを割り当てる」を参照してください。必要に応じて、新しいラベルを追加できます。詳細については、「ラベルの管理」を参照してください。

オブジェクトの位置の検索

イメージ内のオブジェクトの位置を予測するモデルを作成するには、トレーニングデータセットとテストデータセットのイメージにオブジェクト位置の境界ボックスとラベルを定義します。境界ボックスとは、オブジェクトをぴったりと囲んだボックスのことです。次のイメージは Amazon Echo と Amazon Echo Dot を囲む境界ボックスの例を示しています。各境界ボックスにはラベル (Amazon Echo または Amazon Echo Dot) が割り当てられています。

Amazon スマートスピーカー 2 台。1 台は緑の境界ボックス、もう 1 台は青の境界ボックスが、表面を表面とします。

オブジェクトの位置を検索するには、データセットに少なくとも 1 つのラベルが必要です。モデルのトレーニング中に、イメージの境界ボックスの外側の領域を表すラベルが自動的に作成されます。

境界ボックスの割り当て

データセットを作成する際に、イメージの境界ボックス情報を含めることができます。例えば、境界ボックスを含む SageMaker Ground Truth 形式のマニフェストファイルをインポートできます。また、データセットの作成後に境界ボックスを追加できます。詳細については、「境界ボックスによるオブジェクトのラベル付け」を参照してください。必要に応じて、新しいラベルを追加できます。詳細については、「ラベルの管理」を参照してください。

ブランドの位置の検索

ロゴやアニメーション化されたキャラクターなどのブランドの位置を検索する場合は、トレーニングデータセットのイメージに 2 つのタイプのイメージを使用できます。

  • ロゴのみのイメージ。各イメージには、ロゴ名を表すイメージレベルのラベルが 1 つ必要です。例えば、次のイメージのイメージレベルのラベルは Lambda になります。

    オレンジ色の背景に白の Lambda ロゴ。
  • フットボールの試合や建築図など、自然な場所にロゴが入っているイメージ。各トレーニングイメージには、ロゴの各インスタンスを囲む境界ボックスが必要です。例えば、次の画像は、 AWS Lambda ロゴと Amazon Pinpoint ロゴを囲むラベル付き境界ボックスを含むアーキテクチャ図を示しています。

    Lambda AWS サービスがユーザーアクティビティを Amazon Pinpoint にフィードしてレコメンデーションを表示する診断ワークフロー。

トレーニングイメージには、イメージレベルのラベルと境界ボックスを混在させないことを推奨します。

テストイメージには、検索するブランドのインスタンスの周囲に境界ボックスが必要です。トレーニングイメージにラベル付き境界ボックスが含まれている場合のみ、トレーニングデータセットを分割してテストデータセットを作成できます。トレーニングイメージにイメージレベルのラベルしかない場合は、ラベル付き境界ボックスが付いたイメージを含むテストデータセットを作成する必要があります。ブランドの位置を検知するようにモデルをトレーニングする場合は、イメージのラベル付け方法に従って 境界ボックスによるオブジェクトのラベル付けイメージにイメージレベルのラベルを割り当てる を行います。

ブランド検出 のサンプルプロジェクトでは、Amazon Rekognition Custom Labels がラベル付き境界ボックスを使用して、オブジェクトの位置を検出するモデルをトレーニングする方法を示しています。

モデルタイプのラベル要件

次の表を使用して、イメージにラベルを付ける方法を決定します。

イメージレベルのラベルと境界ボックスでラベル付きイメージを 1 つのデータセットにまとめることができます。この場合、Amazon Rekognition Custom Labels は、イメージレベルのモデルを作成するか、オブジェクト位置のモデルを作成するかを選択します。

トレーニングイメージ テストイメージ

画像分類

1 つのイメージにつき 1 つのイメージレベルのラベル

1 つのイメージにつき 1 つのイメージレベルのラベル

マルチラベル分類

1 つのイメージにつき複数のイメージレベルのラベル

1 つのイメージにつき複数のイメージレベルのラベル

ブランドの位置の検索

イメージレベルのラベル (ラベル付き境界ボックスも使用できます)

ラベル付き境界ボックス

オブジェクトの位置の検索

ラベル付き境界ボックス

ラベル付き境界ボックス