翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データセットの目的の設定
プロジェクト内のトレーニングデータセットとテストデータセットにどのようにラベルを付けるかによって、作成するモデルのタイプが決まります。Amazon Rekognition Custom Labels を使用すると、次のことが実行するモデルを作成できます。
オブジェクト、シーン、概念を検出する
モデルによって、イメージ全体に関連付けられているオブジェクト、シーン、概念を分類します。
イメージ分類とマルチラベル分類の 2 つのタイプの分類モデルを作成できます。どちらのタイプの分類モデルでも、モデルはトレーニングに使用されたラベルのセット全体から一致するラベルを検索します。トレーニングデータセットとテストデータセットで、どちらも最低 2 つのラベルが必要です。
画像分類
このモデルは、イメージを事前定義済みのラベルのセットに帰属するものとして分類します。例えば、イメージに居住スペースが含まれているかどうかを判断するモデルが必要な場合があります。次のイメージには living_space のイメージレベルのラベルが付いている場合があります。
このタイプのモデルでは、トレーニングデータセットとテストデータセットのイメージに、イメージレベルのラベルをそれぞれ 1 つ追加します。サンプルプロジェクトについては、「画像分類」を参照してください。
マルチラベル分類
このモデルは、花の種類や葉の有無など、イメージを複数のカテゴリに分類します。例えば、次のイメージには mediterranean_spurge と no_leaves のイメージレベルのラベルが付いている可能性があります。
このタイプのモデルでは、トレーニングデータセットとテストデータセットのイメージに、各カテゴリの画像レベルのラベルを割り当てます。サンプルプロジェクトについては、「マルチラベルイメージ分類」を参照してください。
イメージレベルのラベルの割り当て
イメージが Amazon S3 バケットに保存されている場合は、フォルダ名を使用すればイメージレベルのラベルを自動的に追加できます。詳細については、「Amazon S3 バケットからのイメージのインポート」を参照してください。また、データセットを作成した後で、イメージにイメージレベルのラベルを追加できます。詳細については、「イメージにイメージレベルのラベルを割り当てる」を参照してください。必要に応じて、新しいラベルを追加できます。詳細については、「ラベルの管理」を参照してください。
オブジェクトの位置の検索
イメージ内のオブジェクトの位置を予測するモデルを作成するには、トレーニングデータセットとテストデータセットのイメージにオブジェクト位置の境界ボックスとラベルを定義します。境界ボックスとは、オブジェクトをぴったりと囲んだボックスのことです。次のイメージは Amazon Echo と Amazon Echo Dot を囲む境界ボックスの例を示しています。各境界ボックスにはラベル (Amazon Echo または Amazon Echo Dot) が割り当てられています。
オブジェクトの位置を検索するには、データセットに少なくとも 1 つのラベルが必要です。モデルのトレーニング中に、イメージの境界ボックスの外側の領域を表すラベルが自動的に作成されます。
境界ボックスの割り当て
データセットを作成する際に、イメージの境界ボックス情報を含めることができます。例えば、境界ボックスを含む SageMaker Ground Truth 形式のマニフェストファイルをインポートできます。また、データセットの作成後に境界ボックスを追加できます。詳細については、「境界ボックスによるオブジェクトのラベル付け」を参照してください。必要に応じて、新しいラベルを追加できます。詳細については、「ラベルの管理」を参照してください。
ブランドの位置の検索
ロゴやアニメーション化されたキャラクターなどのブランドの位置を検索する場合は、トレーニングデータセットのイメージに 2 つのタイプのイメージを使用できます。
ロゴのみのイメージ。各イメージには、ロゴ名を表すイメージレベルのラベルが 1 つ必要です。例えば、次のイメージのイメージレベルのラベルは Lambda になります。
フットボールの試合や建築図など、自然な場所にロゴが入っているイメージ。各トレーニングイメージには、ロゴの各インスタンスを囲む境界ボックスが必要です。例えば、次の画像は、 AWS Lambda ロゴと Amazon Pinpoint ロゴを囲むラベル付き境界ボックスを含むアーキテクチャ図を示しています。
トレーニングイメージには、イメージレベルのラベルと境界ボックスを混在させないことを推奨します。
テストイメージには、検索するブランドのインスタンスの周囲に境界ボックスが必要です。トレーニングイメージにラベル付き境界ボックスが含まれている場合のみ、トレーニングデータセットを分割してテストデータセットを作成できます。トレーニングイメージにイメージレベルのラベルしかない場合は、ラベル付き境界ボックスが付いたイメージを含むテストデータセットを作成する必要があります。ブランドの位置を検知するようにモデルをトレーニングする場合は、イメージのラベル付け方法に従って 境界ボックスによるオブジェクトのラベル付け と イメージにイメージレベルのラベルを割り当てる を行います。
ブランド検出 のサンプルプロジェクトでは、Amazon Rekognition Custom Labels がラベル付き境界ボックスを使用して、オブジェクトの位置を検出するモデルをトレーニングする方法を示しています。
モデルタイプのラベル要件
次の表を使用して、イメージにラベルを付ける方法を決定します。
イメージレベルのラベルと境界ボックスでラベル付きイメージを 1 つのデータセットにまとめることができます。この場合、Amazon Rekognition Custom Labels は、イメージレベルのモデルを作成するか、オブジェクト位置のモデルを作成するかを選択します。
例 | トレーニングイメージ | テストイメージ |
---|---|---|
1 つのイメージにつき 1 つのイメージレベルのラベル |
1 つのイメージにつき 1 つのイメージレベルのラベル |
|
1 つのイメージにつき複数のイメージレベルのラベル |
1 つのイメージにつき複数のイメージレベルのラベル |
|
イメージレベルのラベル (ラベル付き境界ボックスも使用できます) |
ラベル付き境界ボックス |
|
ラベル付き境界ボックス |
ラベル付き境界ボックス |