Amazon Rekognition
開発者ガイド

保存済みビデオの使用

Amazon Rekognition Video は、ビデオの分析に使用できる API です。Amazon Rekognition Video では、Amazon Simple Storage Service (Amazon S3) バケットに保存されているビデオ内のラベル、顔、人物、有名人、(明示的および暗示的な) アダルトコンテンツを検出できます。Amazon Rekognition Video は、メディア/エンターテインメントや公共安全などのカテゴリで利用できます。これまでのような物体や人物が撮影されたビデオの人間によるスキャンでは、かなりの時間がかかるだけでなく、エラーも頻繁に発生していました。Amazon Rekognition Video を使うことで、ビデオ全体を通しての項目の検出や、項目が登場したタイミングの検出を自動化することができます。

このセクションには、Amazon Rekognition Video で実行できる検出や認識のタイプの説明、この API の概要、Amazon Rekognition Video の使用例が含まれます。

検出と認識のタイプ

Amazon Rekognition Video を使用することで、ビデオに関する以下の情報を分析できます。

詳細については、「Amazon Rekognition: 仕組み」を参照してください。

Amazon Rekognition VideoAPI の概要

Amazon Rekognition Video は、Amazon S3 バケットに保存されているビデオを処理します。その設計パターンは、複数のオペレーションの非同期セットとなっており、StartLabelDetection などの Start オペレーションを呼び出すことで、ビデオの処理が開始されます。リクエストの完了ステータスが Amazon Simple Notification Service (Amazon SNS) トピックに発行されます。Amazon Simple Queue Service (Amazon SQS) キューまたは AWS Lambda 関数を使うことで、完了ステータスを Amazon SNS トピックから取得できます。完了ステータスを取得したら、GetLabelDetection などの Get オペレーションを呼び出してリクエストの結果を取得します。

以下の図は、Amazon S3 バケットに保存されているビデオ内のラベルを検出するプロセスを示しています。この図では Amazon SQS キューを使用して Amazon SNS トピックから完了ステータスを取得していますが、代わりに AWS Lambda 関数を使用することもできます。

顔と人物の検出プロセスは同じです。以下の表には、非ストレージ型の各 Amazon Rekognition オペレーションの Start および Get オペレーションを示しています。

検出 Start オペレーション Get オペレーション

人員

StartPersonTracking

GetPersonTracking

StartFaceDetection

GetFaceDetection

ラベル

StartLabelDetection

GetLabelDetection

有名人

StartCelebrityRecognition

GetCelebrityRecognition

明示的および暗示的なアダルトコンテンツ

StartContentModeration

GetContentModeration

GetCelebrityRecognition 以外の Get オペレーションでは、入力ビデオ全体でのエンティティ検出時の追跡情報が Amazon Rekognition Video によって返されます。

Amazon Rekognition Video の使用の詳細については、「Amazon Rekognition Video オペレーションの呼び出し」を参照してください。Amazon SQS を使用したビデオ分析例については、「Java または Python を使用した、Amazon S3 バケットに保存されたビデオの分析 (SDK)」を参照してください。AWS CLI の例については、「AWS Command Line Interface を使用したビデオの分析」を参照してください。

ビデオの形式とストレージ

Amazon Rekognition のオペレーションでは、Amazon S3 バケットに保存されているビデオを分析できます。ビデオは H.264 コーデックでエンコードする必要があります。サポートされているファイル形式は MPEG-4 および MOV です。

コーデックとは、データ圧縮による高速な配信と、受信データからオリジナル形式への解凍を可能にするソフトウェアまたはハードウェアです。H.264 コーデックは、ビデオコンテンツの記録、圧縮、配信に広く使われています。1 つのビデオ形式には 1 つ以上のコーデックを含めることができます。MOV または MPEG-4 形式のビデオファイルが Amazon Rekognition Video で動作しない場合、H.264 コーデックがビデオのエンコードに使われているかどうかを確認してください。

保存されているビデオの最大ファイルサイズは 8 GB です。

人物の検索

コレクションに保存された顔のメタデータを使ってビデオ内の人物を検索できます。たとえば、アーカイブされたビデオから特定の人物や複数の人物を検索できます。ソースイメージにある顔のメタデータは、IndexFaces オペレーションを使ってコレクションに保存します。次に StartFaceSearch を使い、コレクション内の顔に対する非同期の検索を開始します。検索結果の取得には GetFaceSearch を使用します。詳細については、「 保存したビデオでの顔の検索」を参照してください。人物の検索は、代表的なストレージ型 Amazon Rekognition オペレーションです。詳細については、「ストレージ型 API オペレーション」を参照してください。

ストリーミングビデオ内の人物を検索するすることもできます。詳細については、「ストリーミングビデオの操作」を参照してください。