顔検出および顔比較の概要 - Amazon Rekognition

英語の翻訳が提供されている場合で、内容が矛盾する場合には、英語版がオリジナルとして取り扱われます。翻訳は機械翻訳により提供されています。

顔検出および顔比較の概要

顔を含む画像を分析する機械学習の主な用途は、顔検出と顔比較の 2 つです。顔検出システムは、「この写真には顔がありますか?」という質問に答えるように設計されています。 顔検出システムは、静止画像またはビデオフレーム内に存在するあらゆる顔の存在、位置、スケール、および (おそらく) 向きを判断します。このシステムは、性別、年齢、顔面の毛といった属性に関係なく、顔の存在を検出するように設計されています。

顔比較システムは、「画像内のある顔は別の画像内の顔と一致しますか?」という質問に答えるように設計されています。 顔比較システムは、顔の画像を撮り、その顔が提供されたデータベース内の他の顔と一致するかどうかに関する予測を行います。顔比較システムは、表情、顔面の毛、年齢に関係なく、顔の一致の可能性を比較および予測するように設計されています。

顔検出システムと顔比較システムの両方で、確率または信頼性スコアの形で予測の信頼レベルの推定値を提供することができます。たとえば、顔検出システムは、あるイメージリージョンは 90% の信頼性スコアで顔であると予測し、別のイメージリージョンは 60% の信頼性スコアで顔であると予測できます。信頼性が高いリージョンほど、顔が含まれる可能性が高くなります。顔検出システムが顔を正しく検出しない場合、または実際の顔の信頼性が低いと予測される場合は、見逃した検出または偽陰性と呼ばれます。顔検出システムが誤って高い信頼性レベルで顔の存在を予測した場合、これは誤ったアラームまたは誤検出です。同様に、顔比較システムは、同一人物に属する 2 つの顔を照合しない (見逃した検出/偽陰性)、または異なる人の 2 つの顔が同じ人であると誤って予測することがあります (誤ったアラーム/誤検出)。

信頼性スコアは、顔の検出および比較システムの重要な要素です。これらのシステムは、顔が画像中に存在するのか、別の画像中の顔と一致するのかを、予測における対応する信頼レベルで予測します。これらのシステムのユーザーは、アプリケーションを設計し、システムの出力に基づいて決定を下す際には、システムによって提供される信頼性スコア/類似度しきい値を考慮する必要があります。たとえば、似ている家族を識別するために使用される写真アプリケーションでは、信頼性しきい値が 80% に設定されている場合、アプリケーションは予測が 80% の信頼性しきい値に達すると一致を返しますが、それ以下の一致は返しません。このタイプのユースケースでは、見逃した検出や誤ったアラームのリスクが低いため、このしきい値は許容範囲内です。ただし、見逃した検出や誤ったアラームのリスクが高いユースケースでは、システムはより高い信頼性レベルを使用するべきです。非常に正確な顔の一致が重要なシナリオでは、99% の信頼性/類似度しきい値を使用する必要があります。推奨される信頼性しきい値の詳細については、「コレクション内での顔の検索」を参照してください。