自動データ設定 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

自動データ設定

自動データ設定を使用して、ビデオ、動画フレーム、テキスト (.txt) ファイル、Amazon S3 に保存されているカンマ区切り値 (.csv) ファイルを使い、Ground Truth コンソールでラベル付けジョブのマニフェストファイルを作成できます。自動データセットアップを使用する場合は、入力データを格納する Amazon S3 の場所と入力データタイプを指定できます。また、Ground Truth は、指定した場所でそのタイプに一致するファイルを検索します。

注記

Ground Truth は、 AWS KMS キーを使用して入力データにアクセスしたり、指定した Amazon S3 の場所に入力マニフェストファイルを書き込んだりしません。ラベル付けジョブを作成するユーザーまたはロールには、Amazon S3 の入力データオブジェクトにアクセスするためのアクセス許可が必要です。

以下の手順を使用する前に、入力イメージまたはファイルが正しく書式設定されていることを確認します。

  • イメージファイル - イメージファイルは、入力ファイルのサイズクォータ にある表に示しているサイズと解像度の制限に準拠する必要があります。

  • テキストファイル - テキストデータは 1 つ以上の .txt ファイルに保存できます。ラベル付けする各項目は標準の改行で区切る必要があります。

  • CSV ファイル - テキストデータは 1 つ以上の .csv ファイルに保存できます。ラベル付けする各項目は個別の行にある必要があります。

  • 動画 — 動画ファイルには、.mp4、.ogg、.webm のいずれかの形式を使用できます。オブジェクト検出またはオブジェクト追跡用に動画ファイルから動画フレームを抽出する場合は、「動画ファイルを提供する」を参照してください。

  • 動画フレーム - 動画フレームは、動画から抽出された画像です。1 つの動画から抽出されたすべての画像は、動画フレームのシーケンスと呼ばれます。動画フレームの各シーケンスには、Amazon S3 で一意のプレフィックスキーが必要です。動画フレームを提供する を参照してください。このデータ型については、「動画フレーム入力データの自動設定」を参照してください。

重要

動画フレームオブジェクトの検出と動画フレームオブジェクトの追跡ラベル付けジョブでの、自動データ設定の使用方法については、「動画フレーム入力データの自動設定」を参照してください。

次の手順に従って、Ground Truth との入力データセット接続を自動的に設定します。

Amazon S3 のデータを Ground Truth と自動的に接続します。
  1. Amazon コンソールのラベル付けジョブの作成ページ SageMakerに移動します。https://console.aws.amazon.com/sagemaker/

    このリンクをクリックすると、バージニア北部 (米国東部 1) AWS リージョンに移動します。入力データが別のリージョンの Amazon S3 バケットにある場合は、そのリージョンに切り替えます。 AWS リージョンを変更するには、ナビゲーションバー で、現在表示されているリージョンの名前を選択します。

  2. [Create labeling job] (ラベル付けジョブを作成する) を選択します 。

  3. [Job name] (ジョブ名) を入力します。

  4. [Input data setup] (入力データの設定) セクションで、[Automated data setup] (自動データ設定) を選択します。

  5. 入力データセットの S3 の場所の Amazon S3 URI を入力します。

  6. 出力データセットの S3 の場所を指定します。これが、データが保存される場所です。

  7. ドロップダウンリストを使用して、[Data type] (データ型)を選択します。

  8. [IAM Role] (IAM ロール) のドロップダウンメニューを使用して、実行ロールを選択します。[Create a new role] (新規ロールを作成) を選択する場合は、このロールにアクセス許可を付与する Amazon S3 バケットを指定します。このロールには、ステップ 5 と 6 で指定した S3 バケットへのアクセス許可が必要です。

  9. [Complete data setup] (完全なデータセットアップ) を選択します。

これにより、ステップ 5 で指定した入力データセットの入力マニフェストが Amazon S3 の場所に作成されます。 SageMaker API、、 AWS CLIまたは AWS SDK を使用してラベル付けジョブを作成する場合は、この入力マニフェストファイルの Amazon S3 URI をパラメータ への入力として使用しますManifestS3Uri

次の GIF は、イメージデータの自動データ設定の使用方法を示しています。この例では、Amazon S3 バケット example-groundtruth-imagesdataset-YYMMDDTHHMMSS.manifest ファイルが作成され、YYMMDDTHHmmSS は入力マニフェストファイルが作成された年 (YY)、月 (MM)、日 (DD)、時刻 (HH)、分 (mm)、秒 (ss) を示します。