Amazon Mechanical Turk ワークフォースを使用する - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Mechanical Turk ワークフォースを使用する

Amazon Mechanical Turk (Mechanical Turk) のワークフォースは、Amazon SageMaker Ground Truth ラベル付けジョブと Amazon Augmented AI の人間によるレビュータスクに最も多くのワーカーを提供します。Amazon Mechanical Turk ワークフォースは、ワールドワイドなリソースです。ワーカーは 1 日 24 時間、年中無休で利用できます。通常、Amazon Mechanical Turk ワークフォースを使用すると、人間によるレビュータスクとラベル付けジョブの反応時間が最も短縮されます。

Amazon Mechanical Turk のワークフォースの請求はすべて、Ground Truth または Amazon Augmented AI 請求の一部として処理されます。Amazon Mechanical Turk ワークフォースを使用するために別の Mechanical Turk アカウントを作成する必要はありません。

重要

機密情報、個人情報、または保護対象の医療情報をこのワークフォースと共有しないでください。保護されたヘルス情報を含むワークロードに対して Amazon A2I を AWS HIPAA 対応サービス (Amazon Textract や Amazon Rekognition など) と組み合わせて使用する場合は、Amazon Mechanical Turk ワークフォースを使用しないでください。

Ground Truth ラベル付けジョブまたは Amazon A2I の人間によるレビューワークフロー (フロー定義) を作成するときに、ワークフォースとして Mechanical Turk を選択できます。SageMaker コンソールと API の両方を使用して、ラベル付けジョブと人間によるレビューワークフローを作成できます。

API オペレーションを使用してラベル付けジョブまたは人間によるレビューワークフローを作成する場合、WorkteamArn の Amazon Mechanical Turk ワークフォースに次の ARN を使用します。region を、ラベル付けジョブまたはヒューマンループの作成に使用している AWS のリージョンに置き換えます。例えば、米国西部 (オレゴン) でラベル付けジョブを作成する場合は、regionus-west-2 に置き換えます。

  • arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

Ground Truth と Amazon A2I では、Mechanical Turk を使用する場合に、入力データに個人を特定できる情報 (PII) を含めることはできません。Mechanical Turk ワークフォースを使用し、入力データに PII がないことを指定しない場合、Ground Truth ラベル付けジョブとAugmented AI タスクは失敗します。Ground Truth ラベル付けジョブを作成するときと、組み込みの統合または StartHumanLoop オペレーションを使用して Amazon A2I ヒューマンループを作成するときに、入力データに PII がないことを指定します。

これらのサービスで Mechanical Turk を使用する方法については、次のセクションを参照してください。

Ground Truth でMechanical Turk を使用する

コンソールまたは CreateLabelingJob オペレーションを使用してラベル付けジョブを作成するときに、Ground Truth で Mechanical Turk を使用できます。

ラベル付けジョブを作成するときは、ジョブの複雑さと必要な品質に基づいて、各データオブジェクトに注釈を付けるワーカーの数を調整することをお勧めします。Amazon SageMaker Ground Truth は、注釈の統合を使用してラベルの品質を向上させます。ワーカーが多いと、より複雑なラベル付けジョブのラベルの品質を改善できますが、シンプルなジョブについては変化しない可能性があります。詳細については、「注釈統合」を参照してください。注釈統合は、Amazon A2I の人間によるレビューワークフローではサポートされていません。

ラベル付けジョブの作成時に Mechanical Turk を使用するには、次の手順に従います (コンソール)。

  1. 以下を使用して、SageMaker コンソールの [Ground Truth] 領域を使用してラベル付けジョブを作成します。ラベル付けジョブの作成 (コンソール)

  2. [Workers] (ワーカー) セクションで [Worker types] (ワーカータイプ) を選択するとき、[Amazon Mechanical Turk] を選択します。

  3. [Task timeout] (タスクタイムアウト) を使用して、ワーカーがタスクを完了しなければならない合計時間を指定します。

  4. [Task expTask expiration] (タスクの有効期限) で、ワーカーがタスクを使用できる時間の合計を指定します。これは、タスクが失敗する前にワーカーがタスクを取得する必要がある期間です。

  5. ドロップダウンリストを使用して、[Price per task] (タスクあたりの料金) を選択します。これは、1 つのタスクを完了することでワーカーが受け取る金額です。

  6. (オプション) 該当する場合は、[The dataset does not contain adult content] (データセットにアダルトコンテンツが含まれていません) を選択します。アダルトコンテンツが含まれている場合、SageMaker は、タスクを表示できる Mechanical Turk ワーカーを制限する場合があります。

  7. Mechanical Turk ワークフォースを使用するには、チェックボックスをオンにして、次のステートメントを読み、確認する必要があります。入力データに機密情報、個人情報、または保護対象の医療情報が含まれている場合は、別のワークフォースを選択する必要があります。

    Mechanical Turk のワークフォースが世界中に所在する独立した請負業者で構成されており、機密情報、個人情報、または保護対象の医療情報をこのワークフォースと共有してはならないことを理解し、同意します。

  8. (オプション) 自動データラベリングを有効にする場合は、[Enable automated data labeling] (自動データラベリングを有効にする) のチェックボックスをオンにします。この機能の詳細は、「データのラベル付けの自動化」を参照してください。

  9. [Additional configuration] (追加設定) で [Number of workers per dataset object] (データセットオブジェクトあたりの作業者数) を指定できます。例えば、このフィールドに 3 と入力すると、3 人のワーカーによって各データオブジェクトがラベル付けされます。

[Create] (作成) を選択してラベル付けジョブを作成する場合、ラベル付けタスクは Mechanical Turk ワーカーに送信されます。

ラベル付けジョブを作成するときに Mechanical Turk を使用するには次の手順に従います (API)。

  1. CreateLabelingJob オペレーションを使用して、ラベル付けジョブを作成 (API) を使いラベル付けジョブを作成します。

  2. WorkteamArn に、以下を使用します。region を、ラベル付けジョブの作成に使用している AWS のリージョンに置き換えます。

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. TaskTimeLimitInSeconds を使用して、ワーカーがタスクを完了しなければならない合計時間を指定します。

  4. TaskAvailabilityLifetimeInSeconds を使用して、ワーカーがタスクを使用できる時間の合計を指定します。これは、タスクが失敗する前にワーカーがタスクを取得する必要がある期間です。

  5. NumberOfHumanWorkersPerDataObject を使用して、データセットオブジェクトあたりのワーカー数を指定します。

  6. PublicWorkforceTaskPrice を使用して、タスクごとの価格を設定します。これは、1 つのタスクを完了することでワーカーが受け取る金額です。

  7. DataAttributes を使用して、入力データに機密情報、個人情報、または保護対象の医療情報が含まれていないことを指定します。

    Ground Truth では、Mechanical Turk ワークフォースを使用する場合に、入力データに個人を特定できる情報 (PII) を含めることはできません。Mechanical Turk を使用し、FreeOfPersonallyIdentifiableInformation フラグを使用して入力データに PII がないことを指定しない場合、ラベル付けジョブは失敗します。

    FreeOfAdultContent フラグを使用して、入力データにアダルトコンテンツが含まれていないことを宣言します。アダルトコンテンツが含まれている場合、SageMaker はタスクを表示できる Mechanical Turk ワーカーを制限する場合があります。

この API の使用方法の例については、GitHub にある以下のノートブックで確認できます。Ground Truth Jupyter ノートブックの例。SageMaker サンプルノートブックノートブックインスタンスで、これらのノートブックにアクセスできます。

Amazon A2I で Mechanical Turk を使用する

コンソールまたは CreateFlowDefinition API オペレーションで、フロー定義とも呼ばれる人間によるレビューワークフローを作成するときに、Amazon A2I で Mechanical Turk を使用するよう指定できます。この人間によるレビューワークフローを使用してヒューマンループを構成する場合は、入力データに PII がないことを指定する必要があります。

人間によるレビューワークフローを作成するときに Mechanical Turk を使用するには、次の手順に従います (コンソール)。

  1. ヒューマンレビューワークフローを作成する (コンソール) を使用し、SageMaker コンソールの Augmented AI セクションで人間によるレビューワークフローを作成します。

  2. [Workers] (ワーカー) セクションで [Worker types] (ワーカータイプ) を選択するとき、[Amazon Mechanical Turk] を選択します。

  3. ドロップダウンリストを使用して、[Price per task] (タスクあたりの料金) を選択します。これは、1 つのタスクを完了することでワーカーが受け取る金額です。

  4. (オプション) [Additional configuration] (追加設定) で、[Number of workers per dataset object] (データセットオブジェクトあたりの作業者数) を指定できます。例えば、このフィールドに 3 と入力すると、3 人のワーカーによって各データオブジェクトがラベル付けされます。

  5. (オプション) [Task timeout] (タスクタイムアウト) を使用して、ワーカーがタスクを完了しなければならない合計時間を指定します。

  6. (オプション) [Task expTask expiration] (タスクの有効期限) で、ワーカーがタスクを使用できる時間の合計を指定します。これは、タスクが失敗する前にワーカーがタスクを取得する必要がある期間です。

  7. 人間によるレビューワークフローを作成したら、パラメータ FlowDefinitionArn に Amazon リソースネーム (ARN) を指定することで、それを使用してヒューマンループを設定できます。組み込みタスクタイプの API オペレーションまたは Amazon A2I ランタイム API オペレーション StartHumanLoop のいずれかを使用し、ヒューマンループを設定します。詳細については、「ヒューマンループを作成および開始する」を参照してください。

    ヒューマンループを設定する場合、DataAttributes 内のコンテンツ分類子 FreeOfPersonallyIdentifiableInformation を使用して、入力データに個人を特定できる情報 (PII) が含まれていないことを指定する必要があります。Mechanical Turk を使用し、入力データに PII がないことを指定しない場合、人間によるレビュータスクは失敗します。

    FreeOfAdultContent フラグを使用して、入力データにアダルトコンテンツが含まれていないことを宣言します。アダルトコンテンツが含まれている場合、SageMaker はタスクを表示できる Mechanical Turk ワーカーを制限する場合があります。

人間によるレビューワークフローを作成するときに Mechanical Turk を使用するには、次の手順に従います (API)。

  1. ヒューマンレビューワークフローを作成する (API) を使用し、CreateFlowDefinition オペレーションを使い人間によるレビューワークフローを作成します。

  2. WorkteamArn に、以下を使用します。region を、ラベル付けジョブの作成に使用している AWS のリージョンに置き換えます。

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. TaskTimeLimitInSeconds を使用して、ワーカーがタスクを完了しなければならない合計時間を指定します。

  4. TaskAvailabilityLifetimeInSeconds を使用して、ワーカーがタスクを使用できる時間の合計を指定します。これは、タスクが失敗する前にワーカーがタスクを取得する必要がある期間です。

  5. TaskCount を使用して、データセットオブジェクトあたりのワーカー数を指定します。例えば、このパラメータに 3 を指定すると、3 人のワーカーによって各データオブジェクトがラベル付けされます。

  6. PublicWorkforceTaskPrice を使用して、タスクごとの価格を設定します。これは、1 つのタスクを完了することでワーカーが受け取る金額です。

  7. 人間によるレビューワークフローを作成したら、パラメータ FlowDefinitionArn に Amazon リソースネーム (ARN) を指定することで、それを使用してヒューマンループを設定できます。組み込みタスクタイプの API オペレーションまたは Amazon A2I ランタイム API オペレーション StartHumanLoop のいずれかを使用し、ヒューマンループを設定します。詳細については、「ヒューマンループを作成および開始する」を参照してください。

    ヒューマンループを設定する場合、DataAttributes 内のコンテンツ分類子 FreeOfPersonallyIdentifiableInformation を使用して、入力データに個人を特定できる情報 (PII) が含まれていないことを指定する必要があります。Mechanical Turk を使用し、入力データに PII がないことを指定しない場合、人間によるレビュータスクは失敗します。

    FreeOfAdultContent フラグを使用して、入力データにアダルトコンテンツが含まれていないことを宣言します。アダルトコンテンツが含まれている場合、SageMaker はタスクを表示できる Mechanical Turk ワーカーを制限する場合があります。

この API の使用方法の例については、GitHub にある以下のノートブックで確認できます。Amazon A2I Jupyter ノートブックの例

Mechanical Turk がサポートされないのはどのような場合ですか。

このワークフォースは、次のシナリオではサポートされません。各シナリオでは、プライベートまたはベンダーのワークフォースを使用する必要があります。

  • Ground Truth 動画ビデオフレームラベル付けジョブと 3D 点群のラベル付けジョブでは、このワークフォースはサポートされていません。

  • 入力データに個人を特定できる情報 (PII) が含まれている場合は、このワークフォースを使用できません。

  • Mechanical Turk は、一部の AWS の特別なリージョンでは使用できません。該当する場合、詳細については特別なリージョンのドキュメントを参照してください。