入力データの動画ファイルまたは動画フレームを選択する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

入力データの動画ファイルまたは動画フレームを選択する

動画フレームオブジェクト検出またはオブジェクト追跡のラベル付けジョブを作成するとき、動画フレームのシーケンス (イメージ) を提供するか、Amazon を使用できます SageMaker Ground Truth に動画ファイルから動画フレームを自動的に抽出できます。これらのオプションの詳細については、次のセクションを参照してください。

動画フレームを提供する

動画フレームは、動画ファイルから抽出されたイメージのシーケンスです。Ground Truth のラベル付けジョブを作成して、ワーカーに複数の動画フレームのラベル付けをさせることができます。各シーケンスは、1 つの動画から抽出されたイメージで構成されます。

動画フレームシーケンスを使用してラベル付けジョブを作成するには、一意のキー名のプレフィックスを使用して、各シーケンスを Amazon S3 に保存する必要があります。Amazon S3 コンソールでは、キー名プレフィックスはフォルダになります。そのため、Amazon S3 コンソールでは、動画フレームの各シーケンスを Amazon S3 の独自のフォルダに配置する必要があります。

例えば、2 つの動画フレームシーケンスがある場合は、キー名のプレフィックス sequence1/sequence2/ を使用してシーケンスを特定します。この例では、シーケンスは s3://DOC-EXAMPLE-BUCKET/video-frames/sequence1/s3://DOC-EXAMPLE-BUCKET/video-frames/sequence2/ にあります。

Ground Truth コンソールを使用して入力マニフェストファイルを作成する場合は、すべてのシーケンスキー名のプレフィックスが Amazon S3 の同じ場所にある必要があります。例えば、Amazon S3 コンソールでは、各シーケンスは s3://DOC-EXAMPLE-BUCKET/video-frames/ のフォルダに配置できます。この例では、最初の動画フレーム (イメージ) のシーケンスが s3://DOC-EXAMPLE-BUCKET/video-frames/sequence1/、2 番目のシーケンスは s3://DOC-EXAMPLE-BUCKET/video-frames/sequence2/ にあります。

重要

ワーカーにラベルを付けさせたい動画フレームのシーケンスが 1 つしかない場合でも、そのシーケンスには Amazon S3 のキー名のプレフィックスが必要です。Amazon S3 コンソールを使用している場合は、シーケンスはフォルダ内にあります。S3 バケットのルートには配置できません。

動画フレームのシーケンスを使用してワーカータスクを作成する場合、Ground Truth はタスクごとに 1 つのシーケンスを使用します。各タスクで、Ground Truth が UTF-8 バイナリ順序を使用して動画フレームを順番に並べます。

例えば、Amazon S3 では、動画フレームは次の順序になります。

[0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg]

これらは、ワーカーのタスクで同じ順序で配置されます。0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg

フレームは、次のような命名規則を使用して順序付けすることもできます。

[frame1.jpg, frame2.jpg, ..., frame11.jpg]

この場合、frame10.jpgframe11.jpg は、ワーカータスクの frame2.jpg の前に来ます。ワーカーには、動画フレームは次の順序で表示されます。frame1.jpg, frame10.jpg, frame11.jpg, frame2.jpg, ..., frame9.jpg

動画ファイルを提供する

コンソールで新しいラベル付けジョブを作成するときに、Ground Truth フレーム分割機能を使用して、動画ファイル (MP4 ファイル) から動画フレームを抽出できます。単一の動画ファイルから抽出された一連の動画フレームは、動画フレームのシーケンスと呼ばれます。

Ground Truth では、動画から最大 2,000 個まで、すべてのフレームを自動的に抽出するか、フレーム抽出の頻度を指定できます。例えば、Ground Truth で動画からフレームを 10 個ごとに抽出するようにできます。

自動データ設定を使用してフレームを抽出する場合、最大 50 個の動画を提供できますが、動画フレームオブジェクト追跡と動画フレームオブジェクト検出のラベル付けジョブを作成する場合には、入力マニフェストファイルは 10 個を超える動画フレームシーケンスファイルを参照できません。自動データ設定コンソールツールを使用して 10 個を超える動画ファイルから動画フレームを抽出する場合は、ツールが生成するマニフェストファイルを変更するか、10 個以下の動画フレームシーケンスファイルを含めるように新しいマニフェストファイルを作成する必要があります。これらのクォータの詳細については、「3D 点群と動画フレームのラベル付けジョブクォータ のクォータ」を参照してください。

動画フレーム抽出ツールを使用するには、「動画フレーム入力データの自動設定」を参照してください。

すべての動画フレームが動画から正常に抽出されると、S3 入力データセットの場所に次の情報が表示されます。

  • キー名のプレフィックス (Amazon S3 コンソール内のフォルダ) は、各動画にちなんで命名されています。これらのプレフィックスはそれぞれ、次のような結果をもたらします。

    • プレフィックス名を指定するために使用される動画から抽出された動画フレームのシーケンス。

    • そのシーケンスを構成するすべてのイメージを特定するために使用されるシーケンスファイル。

  • .manifest 拡張子の入力マニフェストファイル。これはラベル付けジョブの作成に使用されるすべてのシーケンスファイルを特定します。

1 つの動画ファイルから抽出されたすべてのフレームは、ラベル付けタスクに使用されます。複数の動画ファイルから動画フレームを抽出すると、ラベル付けジョブに対して、動画フレームのシーケンスごとに 1 つずつ、複数のタスクが作成されます。

Ground Truth は、一意のキー名のプレフィックスを使用して、入力データセットの Amazon S3 の場所に抽出する動画フレームの各シーケンスを保存します。Amazon S3 コンソールでは、キー名プレフィックスはフォルダになります。