Criar um trabalho de rotulagem (console) - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar um trabalho de rotulagem (console)

É possível usar o console do Amazon SageMaker para criar um trabalho de rotulagem para todos os tipos de tarefas integradas e fluxos de trabalho de rotulagem personalizados rotulagem personalizada. Para tipos de tarefas incorporados, recomendamos que você use essa página junto com a página do seu tipo de tarefa. Cada página de tipo de tarefa inclui detalhes específicos sobre a criação de um trabalho de rotulagem usando esse tipo de tarefa.

É necessário fornecer o seguinte para criar um trabalho de rotulagem no console do SageMaker:

  • Um arquivo de manifesto de entrada no Amazon S3. Você pode colocar seu conjunto de dados de entrada no Amazon S3 e gerar automaticamente um arquivo de manifesto usando o console Ground Truth (não suportado para trabalhos de rotulagem de nuvem de pontos 3D).

    Como alternativa, você pode criar manualmente um arquivo de manifesto de entrada. Para saber como, consulte Dados de entrada.

  • Um bucket do Amazon S3 para armazenar os dados de saída.

  • Uma função do IAM com permissão para acessar seus recursos no Amazon S3 e uma política de execução do SageMaker anexada. Para obter uma solução geral, é possível anexar a política gerenciada, AmazonSageMakerFullAccess, a uma função do IAM e incluir sagemaker em seu nome de bucket.

    Para políticas mais granulares, consulte Atribua permissões do IAM para usar o Ground Truth.

    Os tipos de tarefas de nuvem de pontos 3D têm considerações adicionais de segurança. Saiba mais.

  • Uma equipe de trabalho. Você cria uma equipe de trabalho a partir de uma força de trabalho composta por operadores, fornecedores ou trabalhadores particulares da Amazon Mechanical Turk. Para saber mais, consulte Criar e gerenciar forças de trabalho.

    Não é possível usar a força de trabalho do Amazon Mechanical Turk para trabalhos de rotulagem de nuvem de pontos 3D ou quadros de vídeo.

  • Se você estiver usando um fluxo de trabalho de rotulagem personalizado, será necessário salvar um modelo de tarefa do operador no Amazon S3 e fornecer um URI do Amazon S3 para esse modelo. Para obter mais informações, consulte Etapa 2: Criar seu modelo de tarefa de operador personalizada.

  • (Opcional) Um ARN de chave do AWS KMS se quiser que o SageMaker criptografe a saída do trabalho de rotulagem usando sua própria chave de criptografia do AWS KMS em vez da chave de serviço padrão do Amazon S3.

  • (Opcional) Rótulos existentes para o conjunto de dados usados para o trabalho de rotulagem. Use essa opção se quiser que os operadores ajustem ou aprovem e rejeitem rótulos.

  • Se você quiser criar um trabalho de rotulagem de ajuste ou verificação, deve ter um arquivo de manifesto de saída no Amazon S3 que contenha os rótulos que você deseja ajustar ou verificar. Essa opção só tem suporte para trabalhos de rotulagem de imagens com caixa delimitadora e segmentação semântica, além de trabalhos de rotulagem de nuvem de pontos 3D e quadros de vídeo. É recomendável que você use as instruções Verificar e ajustar rótulos para criar um trabalho de verificação ou ajuste de rotulagem.

Importante

A equipe de trabalho, o arquivo de manifesto de entrada, o bucket de saída e outros recursos do devem estar na mesma região AWS usada para criar o trabalho de rotulagem.

Quando criar um trabalho de rotulagem usando o console do SageMaker, você adiciona instruções e rótulos do operador à interface do usuário fornecida pelo Ground Truth. É possível visualizar e interagir com a interface do usuário do operador ao criar um trabalho de rotulagem no console. Você também pode ver uma prévia da interface do usuário do operador na sua página de tipo de tarefa integrada.

Como criar um trabalho de rotulagem (console)
  1. Faça login no console do SageMaker em https://console.aws.amazon.com/sagemaker/.

  2. No painel de navegação à esquerda, selecione Trabalhos de rotulagem.

  3. Na página Trabalhos de rotulagem, selecione Criar trabalho de rotulagem.

  4. Em Nome do trabalho, insira um nome para o trabalho de rotulagem.

  5. (Opcional) Se quiser identificar os rótulos com uma chave, selecione Quero especificar um nome de atributo de rótulo diferente do nome do trabalho de rotulagem. Se você não selecionar essa opção, o nome do trabalho de rotulagem especificado na etapa anterior será usado para identificar os rótulos no arquivo de manifesto de saída.

  6. Escolha uma configuração de dados para criar uma conexão entre seu conjunto de dados de entrada e o Ground Truth.

    • Para configuração automatizada de dados:

    • Para configuração manual de dados:

      • Em Local do conjunto de dados de entrada, forneça o local no Amazon S3 onde o arquivo de manifesto de entrada está localizado. Por exemplo, se o arquivo de manifesto de entrada, manifest.json, estiver localizado em example-bucket, insira s3://example-bucket/manifest.json.

      • Em Local do conjunto de dados de saída, forneça o local do Amazon S3 onde você deseja que o Ground Truth armazene os dados de saída do trabalho de rotulagem.

  7. Em Função do IAM, escolha uma função existente de função do IAM ou crie uma função do IAM com permissão para acessar seus recursos no Amazon S3, para gravar no bucket de saída do Amazon S3 especificado acima e com uma política de execução do SageMaker anexada.

  8. (Opcional) Em Configuração adicional, é possível especificar quanto do conjunto de dados você deseja que os operadores rotulem e se deseja que o SageMaker criptografe os dados de saída para o trabalho de rotulagem usando uma chave de criptografia AWS KMS. Para criptografar os dados de saída, é necessário ter as permissões necessárias AWS KMS anexadas à função do IAM fornecida na etapa anterior. Para obter mais detalhes, consulte Atribua permissões do IAM para usar o Ground Truth.

  9. Na seção Tipo de tarefa, em Categoria da tarefa, use o menu suspenso para selecionar a categoria da tarefa.

  10. Em Seleção de tarefas, escolha o tipo de tarefa.

  11. (Opcional) Forneça tags para o trabalho de rotulagem a fim de facilitar sua localização no console posteriormente.

  12. Escolha Próximo.

  13. Na seção Trabalhadores, escolha o tipo de força de trabalho que você gostaria de usar. Para obter mais detalhes sobre suas opções de força de trabalho, consulte Criar e gerenciar forças de trabalho.

  14. Depois de selecionar a força de trabalho, especifique o Tempo limite da tarefa. Esse é o tempo máximo que um operador tem para trabalhar em uma tarefa.

    Para tarefas de anotação em nuvem de pontos 3D, o tempo limite da tarefa padrão é de três dias. O tempo limite padrão para classificação de texto e imagem e trabalhos de rotulagem de verificação de rótulos é de cinco minutos. O tempo limite padrão para todos os outros trabalhos de rotulagem é de 60 minutos.

  15. (Opcional) Para tipos de tarefas de caixa delimitadora, segmentação semântica, quadros de vídeo e nuvem de pontos 3D, você pode selecionar Exibir rótulos existentes se quiser exibir rótulos para o conjunto de dados de entrada a fim de que os operadores verifiquem ou ajustem.

    Para trabalhos de rotulagem de caixa delimitadora e segmentação semântica, isso criará um trabalho de rotulagem de ajuste.

    Para trabalhos de rotulagem de nuvem de pontos 3D e quadros de vídeo:

    • Selecione Ajuste para criar uma tarefa de rotulagem de ajuste. Quando selecionar essa opção, você pode adicionar novos rótulos, mas não pode remover ou editar rótulos existentes do trabalho anterior. Opcionalmente, você pode escolher os atributos da categoria do rótulo e os atributos do quadro que deseja que os trabalhadores editem. Para tornar um atributo editável, marque a caixa de seleção Permitir que os trabalhadores editem esse atributo para esse atributo.

      Se preferir, você pode fornecer atributos da categoria de rótulo e do quadro.

    • Selecione Verificação para criar um trabalho de rotulagem de ajuste. Quando selecionar essa opção, você não pode adicionar, modificar ou remover rótulos existentes do trabalho anterior. Se preferir, você pode escolher os atributos da categoria do rótulo e os atributos do quadro que deseja que os trabalhadores editem. Para tornar um atributo editável, marque a caixa de seleção Permitir que os trabalhadores editem esse atributo para esse atributo.

      Recomendamos que você adicione novos atributos de categoria de rótulo aos rótulos que deseja que os trabalhadores verifiquem ou adicione um ou mais atributos de quadro para que os trabalhadores forneçam informações sobre o quadro inteiro.

    Para obter mais informações, consulte Verificar e ajustar rótulos.

  16. Configure a interface de usuário dos seus trabalhadores:

    • Se estiver usando um tipo de tarefa integrado, especifique as instruções e os rótulos dos trabalhadores.

      • Para classificação de imagens e classificação de texto (rótulo único e múltiplos), você deve especificar pelo menos duas categorias de rótulos. Para todos os outros tipos de tarefas integradas, você deve especificar pelo menos uma categoria de rótulo.

      • (Opcional) Se estiver criando um trabalho de rotulagem de nuvem de pontos 3D ou quadro de vídeo, poderá especificar atributos de categoria de rótulo (não compatíveis com segmentação semântica de nuvem de pontos 3D) e atributos de quadro. Os atributos da categoria de rótulo podem ser atribuídos a um ou mais rótulos. Os atributos do quadro aparecerão em cada nuvem de pontos ou rótulo dos trabalhadores do quadro de vídeo. Para saber mais, consulte Interface do usuário (UI) do operador para a nuvem de pontos 3D e Interface do usuário (UI) do operador para o quadro de vídeo.

      • (Opcional) Adicione instruções adicionais para ajudar seu operador a concluir sua tarefa.

    • Se estiver criando um fluxo de trabalho de rotulagem personalizado, deverá:

      • Inserir um modelo personalizado na caixa de código. Modelos personalizados podem ser criados usando uma combinação de HTML, a linguagem de modelagem Liquid e nossos componentes web pré-criados. Se preferir, você pode escolher o modelo base no menu suspenso para começar.

      • Especificar as funções do Lambda de pré-anotação e pós-anotação. Para saber como criar essas funções, consulte Etapa 3: processando com AWS Lambda.

  17. (Opcional) É possível selecionar Ver pré-visualização para visualizar as instruções do operador, os rótulos e interagir com a interface do usuário do operador. Certifique-se de que o bloqueador de pop-ups do navegador esteja desativado antes de gerar a pré-visualização.

  18. Escolha Criar.

Depois de criar com êxito o trabalho de rotulagem, você será redirecionado para a página Trabalhos de rotulagem. O status do trabalho de rotulagem que você acabou de criar estará Em andamento. Esse status é atualizado progressivamente à medida que os operadores concluem as tarefas. Quando todas as tarefas forem concluídas com êxito, o status será alterado para Concluído.

Se ocorreu um problema durante a criação do trabalho de rotulagem, seu status será alterado para Falhou.

Para ver mais detalhes sobre o trabalho, selecione o nome do trabalho de rotulagem.

Próximas etapas

Depois que o status do trabalho de rotulagem mudar para Concluído, você poderá visualizar os dados de saída no bucket do Amazon S3 especificado durante a criação desse trabalho de rotulagem. Para obter detalhes sobre o formato dos dados de saída, consulte Dados de saída.