ラベル付けジョブの作成 (コンソール) - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ラベル付けジョブの作成 (コンソール)

Amazon SageMaker コンソールを使用して、Ground Truth の組み込みタスクタイプとカスタムラベル付けワークフローのすべてに対してラベル付けジョブを作成できます。組み込みのタスクタイプの場合は、タスクタイプのページとあわせてこのページを使用することをお勧めします。各タスクタイプのページには、そのタスクタイプを使用したラベル付けジョブの作成に関する具体的な詳細が記載されています。

SageMaker コンソールでラベル付けジョブを作成するには、以下を指定する必要があります。

  • Amazon S3 の入力マニフェストファイル。入力データセットを Amazon S3 に配置し、Ground Truth コンソールを使用してマニフェストファイルを自動的に生成できます(3D 点群ラベル付けジョブではサポートされていません)。

    入力マニフェストファイルを手動で作成することもできます。この方法の詳細は、「入力データ」を参照してください。

  • 出力データを格納する Amazon S3 バケット。

  • Amazon S3 のリソースへのアクセス許可と SageMaker の実行ポリシーがアタッチされた IAM ロール。一般的なソリューションとして、管理ポリシー AmazonSageMakerFullAccess を IAM ロールにアタッチして、sagemaker をバケット名に含めることができます。

    より詳細なポリシーについては、「Ground Truth を使用するための IAM アクセス権限を割り当てる」を参照してください。

    3D 点群タスクタイプには、セキュリティに関する追加の考慮事項があります。詳細はこちら

  • 作業チーム。Amazon Mechanical Turk のワーカー、ベンダー、または独自のプライベートワーカーで構成されるワークフォースから作業チームを作成します。詳細については、「ワークフォースの作成と管理」を参照してください。

    3D 点群または動画フレームのラベル付けジョブに Mechanical Turk のワークフォースを使用することはできません。

  • カスタムラベル付けワークフローを使用する場合は、ワーカータスクテンプレートを Amazon S3 に保存し、そのテンプレートに Amazon S3 URI を指定する必要があります。詳細については、「ステップ 2: カスタムワーカータスクテンプレートの作成」を参照してください。

  • (オプション) SageMaker でデフォルトの Amazon S3 サービスキーではなく、独自の AWS KMS 暗号化キーを使用してラベル付けジョブの出力を暗号化する場合は、AWS KMS キーの ARN。

  • (オプション) ラベル付けジョブに使用するデータセットの既存のラベル。ワーカーがラベルの調整、または承認および却下を行えるようにする場合は、このオプションを使用します。

  • 調整または検証のラベル付けジョブを作成する場合は、Amazon S3 に、調整または検証するラベルを含む出力マニフェストファイルが必要です。このオプションは、境界ボックスとセマンティックセグメンテーションイメージのラベル付けジョブと、3D 点群および動画フレームラベル付けジョブでのみサポートされます。ラベルの検証と調整 の指示を使用して、検証または調整ラベル付けジョブを作成することをお勧めします。

重要

作業チーム、入力マニフェストファイル、出力バケット、その他の Amazon S3 のリソースは、ラベル付けジョブの作成に使用する AWS リージョンと同じリージョンに存在する必要があります。

SageMaker コンソールを使用してラベル付けジョブを作成する場合は、ワーカー向け指示書とラベルを Ground Truth が提供するワーカー UI に追加します。コンソールでラベル付けジョブを作成するときに、ワーカー UI のプレビューと操作ができます。ワーカー UI のプレビューは、「組み込みタスクタイプ」ページでも確認できます。

ラベル付けジョブを作成するには (コンソール)

  1. SageMaker コンソール (https://console.aws.amazon.com/sagemaker/) にサインインします。

  2. 左のナビゲーションペインで、[ラベル付けジョブ] を選択します。

  3. [ラベル付けジョブ] ページで、[ラベル付けジョブを作成] を選択します。

  4. [ジョブ名] に、ラベル付けジョブの名前を入力します。

  5. (オプション) キーを使用してラベルを識別する場合は、[ラベル付けジョブ名とは異なるラベル属性名を指定したいです] を選択します。このオプションを選択しない場合、前のステップで指定したラベル付けジョブ名を使用して、出力マニフェストファイル内のラベルを識別します。

  6. 設定するデータ設定を選択して、入力データセットと Ground Truth 間の接続を設定します。

    • 自動データセットアップの場合、次を実行します。

    • 手動データセットアップの場合、次を実行します。

      • [Input dataset location] (入力データセットの場所) に、入力マニフェストファイルのある Amazon S3 の場所を指定します。例えば、入力マニフェストファイル manifest.json が example-bucket にある場合は、s3: //example-bucket/manifest.json と入力します。

      • [Output dataset location] (出力データセットの場所) に、Ground Truth でラベル付けジョブの出力データを格納するAmazon S3 の場所を指定します。

  7. [IAM ロール] で、既存の IAM ロールを選択するか、上で指定した出力 S3 バケットに書き込むための Amazon S3 のリソースへのアクセス許可を持ち、SageMaker の実行ポリシーがアタッチされた、IAM ロールを作成します。

  8. (オプション) [Additional configuration] (追加設定) で、ワーカーがラベルを付けるデータセットの量と、SageMaker で AWS KMS 暗号化キーを使用してラベル付けジョブの出力データを暗号化するかどうかを指定できます。出力データを暗号化するには、前のステップで指定した IAM ロールに必要な AWS KMS アクセス許可がアタッチされている必要があります。詳細については、「Ground Truth を使用するための IAM アクセス権限を割り当てる」を参照してください。

  9. [Task type] (タスクタイプ) セクションの [Task category] (タスクカテゴリ) で、ドロップダウンメニューを使用してタスクカテゴリを選択します。

  10. [タスク選択] で、タスクタイプを選択します。

  11. (オプション) ラベル付けジョブにタグを指定すると、後でラベル付けジョブをコンソールで見つけやすくなります。

  12. [Next] (次へ) を選択します。

  13. [ワーカー] セクションで、使用するワークフォースのタイプを選択します。ワークフォースオプションの詳細については、「ワークフォースの作成と管理」を参照してください。

  14. (オプション) ワークフォースを選択したら、[タスクのタイムアウト] を指定します。これは、ワーカーがタスクに取り組むことのできる最大時間です。

    3D 点群注釈タスクの場合、デフォルトのタスクのタイムアウトは 3 日です。テキストと画像の分類、ラベル検証のラベル付けジョブの場合、デフォルトのタイムアウトは 5 分です。その他すべてのラベルリングジョブの場合、デフォルトのタイムアウトは 60 分です。

  15. (オプション) 境界ボックス、セマンティックセグメンテーション、動画フレーム、3D 点群タスクタイプで、ワーカーが確認または調整する入力データセットのラベルを表示する場合は、[Display existing labels] (既存のラベルを表示) を選択します。

    境界ボックスジョブとセマンティックセグメンテーションのラベル付けジョブでは、調整ラベル付けジョブが作成されます。

    3D 点群と動画フレームのラベル付けジョブの場合は、次の手順を実行します。

    • [Adjustment] (調整) をクリックして、調整ラベル付けジョブを作成します。このオプションを選択すると新しいラベルを追加できますが、前のジョブから既存のラベルを削除または編集することはできません。必要に応じて、ワーカーが編集するラベルカテゴリ属性とフレーム属性を選択できます。属性を編集可能にする場合は、その属性で [Allow workers to edit this attribute] (ワーカーにこの属性の編集を許可する) チェックボックスをオンにします。

      必要に応じて、ラベルカテゴリとフレーム属性を追加できます。

    • [Verification] (検証) をクリックして、検証ラベル付けジョブを作成します。このオプションを選択すると、前のジョブから既存のラベルを追加、変更、または削除することはできません。必要に応じて、ワーカーが編集するラベルカテゴリ属性とフレーム属性を選択できます。属性を編集可能にする場合は、その属性で [Allow workers to edit this attribute] (ワーカーにこの属性の編集を許可する) チェックボックスをオンにします。

      ワーカーが確認するラベルに新しいラベルカテゴリ属性を追加するか、1 つ以上のフレーム属性を追加して、ワーカーがフレーム全体に関する情報を提供できるようにすることをお勧めします。

    詳細については、「ラベルの検証と調整」を参照してください。

  16. ワーカーの UI を設定します。

    • 組み込みのタスクタイプを使用している場合は、ワーカー向け指示書とラベルを指定します。

      • イメージ分類とテキストの分類 (単一ラベルとマルチラベル) では、少なくとも 2 つのラベルカテゴリを指定する必要があります。その他の組み込みのタスクタイプについては、少なくとも 1 つのラベルカテゴリを指定する必要があります。

      • (オプション) 3D 点群または動画フレームのラベル付けジョブを作成する場合、ラベルカテゴリ属性 (3D 点群のセマンティックセグメンテーションではサポートされていません) とフレーム属性を指定できます。ラベルカテゴリ属性は、1 つのラベルまたはラベルに割り当てることができます。フレーム属性は、各点群または動画フレームワーカーラベルに表示されます。詳細について、3D 点群は ワーカーユーザーインターフェイス (UI) を、動画フレームは ワーカーユーザーインターフェイス (UI) を参照してください。

      • (オプション) ワーカーがタスクを完了しやすいよう、追加指示を追加します。

    • カスタムラベル付けワークフローを作成する場合は、次の操作を行う必要があります。

      • コードボックスにカスタムテンプレートと入力します。カスタムテンプレートは、HTML、Liquid テンプレート言語、事前構築された ウェブコンポーネントを組み合わせて作成できます。必要に応じて、ドロップダウンメニューからベーステンプレートを選択して開始することもできます。

      • 注釈前と注釈後の Lambda 関数を指定します。これらの 関数の作成方法については、「ステップ 3: を使用した処理AWS Lambda」を参照してください。

  17. (オプション) [See preview] (プレビューを表示) を選択して、ワーカー向け指示書とラベルをプレビューし、ワーカー UI を操作できます。プレビューを生成する前に、ブラウザのポップアップブロックが無効になっていることを確認してください。

  18. [Create] (作成) を選択します。

ラベル付けジョブが正常に作成されると、[ラベル付けジョブ] ページにリダイレクトされます。作成したラベル付けジョブのステータスは [進行中] になります。ワーカーがタスクを完了するにつれて、このステータスは徐々に更新されます。すべてのタスクが正常に完了すると、ステータスは [完了済み] に変わります。

ラベル付けジョブの作成中に問題が発生した場合、ステータスは [失敗] に変わります。

ジョブの詳細を表示するには、ラベル付けジョブ名を選択します。

次のステップ

ラベル付けジョブのステータスが [Completed] (完了済み) に変わったら、そのラベル付けジョブの作成時に指定した Amazon S3 バケットの出力データを表示できます。出力データの形式の詳細については、「出力データ」を参照してください。