Usar a força de trabalho Amazon Mechanical Turk - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usar a força de trabalho Amazon Mechanical Turk

A força de trabalho do Amazon Mechanical Turk (Mechanical Turk) fornece o maior número de trabalhadores para seu trabalho de etiquetagem no Amazon Ground SageMaker Truth e para sua tarefa de revisão humana com IA aumentada da Amazon. A força de trabalho do Amazon Mechanical Turk é um recurso mundial. Trabalhadores estão disponíveis 24 horas por dia, 7 dias por semana. Normalmente, você obtém o retorno mais rápido para as tarefas de análise humana e para os trabalhos de rotulagem quando usa a força de trabalho do Amazon Mechanical Turk.

Qualquer cobrança da força de trabalho do Amazon Mechanical Turk é tratada como parte do faturamento do Ground Truth ou de IA Aumentada do Amazon. Não é necessário criar uma conta separada do Mechanical Turk para usar a força de trabalho do Amazon Mechanical Turk.

Importante

Você não deve compartilhar informações confidenciais, informações pessoais ou informações de saúde protegidas com essa força de trabalho. Você não deve usar a força de trabalho do Amazon Mechanical Turk ao usar o Amazon A2I em conjunto com serviços AWS qualificados pela HIPAA, como o Amazon Textract e o Amazon Rekognition, para cargas de trabalho contendo informações de saúde protegidas.

Você pode escolher o Mechanical Turk como sua força de trabalho ao criar um trabalho de rotulagem do Ground Truth ou um fluxo de trabalho de análise humana Amazon A2I (definição de fluxo). Você pode criar um trabalho de rotulagem e um fluxo de trabalho de revisão humana usando o SageMaker console e a API.

Ao usar uma operação de API para criar um trabalho de rotulagem ou um fluxo de trabalho de revisão humana, você usa o seguinte ARN para a força de trabalho da Amazon Mechanical Turk para sua WorkteamArn. regionSubstitua pela AWS região que você está usando para criar o trabalho de rotulagem ou loops humanos. Por exemplo, se você criar uma tarefa de rotulagem no Oeste dos EUA (Oregon), substitua region por us-west-2.

  • arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

A Ground Truth e o Amazon A2I exigem que seus dados de entrada estejam livres de informações de identificação pessoal (PII) quando você usa o Mechanical Turk. Se você usar a força de trabalho do Mechanical Turk e não especificar que seus dados de entrada estão livres de PII, seus trabalhos de rotulagem da Ground Truth e tarefas de IA aumentada falharão. Você especifica que seus dados de entrada estão livres de PII ao criar um trabalho de rotulagem do Ground Truth e ao criar um loop humano Amazon A2I usando uma integração incorporada ou a operação StartHumanLoop.

Use as seções a seguir para aprender a usar o Mechanical Turk com esses serviços.

Use o Mechanical Turk com Ground Truth

Você pode usar o Mechanical Turk com Ground Truth ao criar uma tarefa de rotulagem usando o console ou a operação CreateLabelingJob.

Quando criar um trabalho de rotulagem, recomendamos que ajuste o número de trabalhadores que fazem anotações em cada objeto de dados com base na complexidade do trabalho e na qualidade de que você precisa. O Amazon SageMaker Ground Truth usa a consolidação de anotações para melhorar a qualidade das etiquetas. Mais trabalhadores podem fazer a diferença na qualidade dos rótulos para trabalhos de rotulagem mais complexos, mas podem não fazer diferença para trabalhos mais simples. Para ter mais informações, consulte Consolidar anotações. Observe que a consolidação de anotações não é compatível com fluxos de trabalho de análise humana do Amazon A2I.

Para usar o Mechanical Turk ao criar uma tarefa de rotulagem (console):
  1. Use o seguinte para criar um trabalho de rotulagem usando a área Ground Truth do SageMaker console:Criar um trabalho de rotulagem (console).

  2. Ao selecionar tipos de trabalhadores na seção Trabalhadores, selecione Amazon Mechanical Turk.

  3. Especifique a quantidade total de tempo que os trabalhadores têm para concluir uma tarefa usando o tempo limite da tarefa.

  4. Especifique o tempo total em que uma tarefa permanece disponível para os trabalhadores em Expiração da tarefa. Esse é o tempo em que os trabalhadores precisam realizar uma tarefa antes que ela falhe.

  5. Selecione o preço por tarefa usando a lista suspensa. Essa é a quantia em dinheiro que um trabalhador recebe por concluir uma única tarefa.

  6. (Opcional) Se aplicável, selecione O conjunto de dados não contém conteúdo adulto. SageMaker pode restringir os funcionários do Mechanical Turk que podem visualizar sua tarefa se ela contiver conteúdo adulto.

  7. Você deve ler e confirmar a declaração a seguir marcando a caixa de seleção para usar a força de trabalho da Mechanical Turk. Se seus dados de entrada contiverem informações confidenciais, informações pessoais ou informações de saúde protegidas, você deverá selecionar outra força de trabalho.

    Você entende e concorda que a força de trabalho da Mechanical Turk consiste em prestadores de serviços independentes localizados em todo o mundo e que você não deve compartilhar informações confidenciais, informações pessoais ou informações de saúde protegidas com essa força de trabalho.

  8. (Opcional) Marque a caixa de seleção ao lado de Ativar rotulagem automática de dados se quiser ativar a rotulagem automática de dados. Para saber mais sobre esse atributo, consulte Automatizar a rotulagem de dados.

  9. Você pode especificar o número de trabalhadores por objeto do conjunto de dados em Configuração adicional. Por exemplo, se você inserir 3 nesse campo, cada objeto de dados será rotulado por 3 trabalhadores.

Quando você cria seu trabalho de rotulagem selecionando Criar, suas tarefas de rotulagem são enviadas aos trabalhadores da Mechanical Turk.

Para usar a Mechanical Turk ao criar uma tarefa de rotulagem (API):
  1. Para criar um trabalho de rotulagem com a operação CreateLabelingJob, use: Criar um trabalho de rotulagem (API).

  2. Use o seguinte para WorkteamArn. regionSubstitua pela AWS região que você está usando para criar o trabalho de etiquetagem.

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. Use TaskTimeLimitInSeconds para especificar a quantidade total de tempo que os trabalhadores têm para concluir uma tarefa.

  4. Use TaskAvailabilityLifetimeInSeconds para especificar o tempo total em que uma tarefa permanece disponível para os trabalhadores. Esse é o tempo em que os trabalhadores precisam realizar uma tarefa antes que ela falhe.

  5. Use NumberOfHumanWorkersPerDataObject para especificar o número de trabalhadores por objeto do conjunto de dados.

  6. Use PublicWorkforceTaskPrice para definir o preço por tarefa. Essa é a quantia em dinheiro que um trabalhador recebe por concluir uma única tarefa.

  7. Use DataAttributes para especificar que seus dados de entrada estejam livres de informações confidenciais, informações pessoais ou informações de saúde protegidas.

    O Ground Truth exige que seus dados de entrada estejam livres de informações de identificação pessoal (PII) quando você usa o Mechanical Turk. Se você usa o Mechanical Turk e não especifica que seus dados de entrada estão livres de PII usando o sinalizador FreeOfPersonallyIdentifiableInformation, seu trabalho de rotulagem irá falhar.

    Use a FreeOfAdultContent bandeira para declarar que seus dados de entrada estão livres de conteúdo adulto. SageMaker pode restringir os funcionários do Mechanical Turk que podem visualizar sua tarefa se ela contiver conteúdo adulto.

Você pode ver exemplos de como usar essa API nos seguintes notebooks, encontrados em GitHub: Ground Truth Jupyter Notebook Examples. Você pode acessar esses cadernos SageMaker Blocos de anotações de exemplo em uma instância de notebook.

Usar o Mechanical Turk com o Amazon A2I

Você pode especificar que deseja usar o Mechanical Turk com o Amazon A2I ao criar um fluxo de trabalho de revisão humana, também conhecido como definição de fluxo, no console ou com a operação da API CreateFlowDefinition. Quando usar esse fluxo de trabalho de análise humana para configurar loops humanos, você deve especificar que seus dados de entrada estejam livres de PII.

Para usar o Mechanical Turk ao criar um fluxo de trabalho de análise humana (console):
  1. Use o seguinte para criar um fluxo de trabalho de revisão humana na seção Augmented AI SageMaker do consoleCriar um fluxo de trabalho de análise humana (console):.

  2. Quando selecionar tipos de trabalhadores na seção Trabalhadores, selecione Amazon Mechanical Turk.

  3. Selecione o preço por tarefa usando a lista suspensa. Essa é a quantia em dinheiro que um trabalhador recebe por concluir uma única tarefa.

  4. (Opcional) Você pode especificar o número de trabalhadores por objeto do conjunto de dados em Configuração adicional. Por exemplo, se você inserir 3 nesse campo, cada objeto de dados será rotulado por 3 trabalhadores.

  5. (Opcional) Especifique a quantidade total de tempo que os trabalhadores têm para concluir uma tarefa usando o tempo limite da tarefa.

  6. (Opcional) Especifique o tempo total em que uma tarefa permanece disponível para os trabalhadores em Expiração da tarefa. Esse é o tempo em que os trabalhadores precisam realizar uma tarefa antes que ela falhe.

  7. Depois de criar seu fluxo de trabalho de revisão humana, você pode usá-lo para configurar um loop humano fornecendo seu nome de recurso da Amazon (ARN) no parâmetro FlowDefinitionArn. Você configura um loop humano usando uma das operações de API de um tipo de tarefa Integrada ou a operação de API de tempo de execução do Amazon A2I. StartHumanLoop Para saber mais, consulte Criar e iniciar um loop humano.

    Quando configurar seu loop humano, você deve especificar que seus dados de entrada estejam livres de informações de identificação pessoal (PII) usando o classificador de conteúdo FreeOfPersonallyIdentifiableInformation em DataAttributes. Se você usar o Mechanical Turk e não especificar que seus dados de entrada estão livres de PII, suas tarefas de análise humana falharão.

    Use a FreeOfAdultContent bandeira para declarar que seus dados de entrada estão livres de conteúdo adulto. SageMaker pode restringir os funcionários do Mechanical Turk que podem visualizar sua tarefa se ela contiver conteúdo adulto.

Para usar o Mechanical Turk ao criar um fluxo de trabalho de análise humana (API):
  1. Use o seguinte para criar um fluxo de trabalho de análise humana usando a operação CreateFlowDefinition: Criar um fluxo de trabalho de análise humana (API).

  2. Use o seguinte para WorkteamArn. regionSubstitua pela AWS região que você está usando para criar o trabalho de etiquetagem.

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. Use TaskTimeLimitInSeconds para especificar a quantidade total de tempo que os trabalhadores têm para concluir uma tarefa.

  4. Use TaskAvailabilityLifetimeInSeconds para especificar o tempo total em que uma tarefa permanece disponível para os trabalhadores. Esse é o tempo em que os trabalhadores precisam realizar uma tarefa antes que ela falhe.

  5. Use TaskCount para especificar o número de trabalhadores por objeto do conjunto de dados. Por exemplo, se você especificar 3 para esse parâmetro, cada objeto de dados será rotulado por 3 trabalhadores.

  6. Use PublicWorkforceTaskPrice para definir o preço por tarefa. Essa é a quantia em dinheiro que um trabalhador recebe por concluir uma única tarefa.

  7. Depois de criar seu fluxo de trabalho de revisão humana, você pode usá-lo para configurar um loop humano fornecendo seu nome de recurso da Amazon (ARN) no parâmetro FlowDefinitionArn. Você configura um loop humano usando uma das operações de API de um tipo de tarefa Integrada ou a operação de API de tempo de execução do Amazon A2I. StartHumanLoop Para saber mais, consulte Criar e iniciar um loop humano.

    Quando configurar seu loop humano, você deve especificar que seus dados de entrada estejam livres de informações de identificação pessoal (PII) usando o classificador de conteúdo FreeOfPersonallyIdentifiableInformation em DataAttributes. Se você usar o Mechanical Turk e não especificar que seus dados de entrada estão livres de PII, suas tarefas de análise humana falharão.

    Use a FreeOfAdultContent bandeira para declarar que seus dados de entrada estão livres de conteúdo adulto. SageMaker pode restringir os funcionários do Mechanical Turk que podem visualizar sua tarefa se ela contiver conteúdo adulto.

Você pode ver exemplos de como usar essa API nos seguintes notebooks, encontrados em GitHub: Amazon A2I Jupyter Notebook Examples.

Quando o Mechanical Turk não é suportado?

Essa força de trabalho não é suportada nos cenários a seguir. Em cada cenário, você deve usar uma força de trabalho privada ou de um fornecedor.

  • Essa força de trabalho não é compatível com trabalhos de rotulagem de quadros de vídeo da Ground Truth e trabalhos de rotulagem de nuvem de pontos 3D.

  • Você não pode usar esta força de trablaho se seus dados contiverem informações de identificação pessoal (PII).

  • O Mechanical Turk não está disponível em algumas regiões AWS especiais. Se aplicável, consulte a documentação da sua região especial para obter mais informações.