Criar um trabalho de rotulagem (console)

Você pode usar o console Amazon SageMaker AI para criar um trabalho de rotulagem para todos os tipos de tarefas integradas e fluxos de trabalho de rotulagem personalizados do Ground Truth. Para tipos de tarefas incorporados, recomendamos que você use essa página junto com a página do seu tipo de tarefa. Cada página de tipo de tarefa inclui detalhes específicos sobre a criação de um trabalho de rotulagem usando esse tipo de tarefa.

Você precisa fornecer o seguinte para criar um trabalho de rotulagem no console do SageMaker AI:

Um arquivo de manifesto de entrada no Amazon S3. Você pode colocar seu conjunto de dados de entrada no Amazon S3 e gerar automaticamente um arquivo de manifesto usando o console Ground Truth (não suportado para trabalhos de rotulagem de nuvem de pontos 3D).

Como alternativa, você pode criar manualmente um arquivo de manifesto de entrada. Para saber como, consulte Dados de entrada.
Um bucket do Amazon S3 para armazenar os dados de saída.
Uma função do IAM com permissão para acessar seus recursos no Amazon S3 e com uma política de execução de SageMaker IA anexada. Para uma solução geral, você pode anexar a política gerenciada, AmazonSageMakerFullAccess, a uma função do IAM e incluí-la sagemaker no nome do seu bucket.

Para políticas mais granulares, consulte Atribua permissões do IAM para usar o Ground Truth.

Os tipos de tarefas de nuvem de pontos 3D têm considerações adicionais de segurança. Saiba mais.
Uma equipe de trabalho. Você cria uma equipe de trabalho a partir de uma força de trabalho composta por operadores, fornecedores ou trabalhadores particulares da Amazon Mechanical Turk. Para saber mais, consulte Forças de trabalho.

Não é possível usar a força de trabalho do Amazon Mechanical Turk para trabalhos de rotulagem de nuvem de pontos 3D ou quadros de vídeo.
Se você estiver usando um fluxo de trabalho de rotulagem personalizado, será necessário salvar um modelo de tarefa do operador no Amazon S3 e fornecer um URI do Amazon S3 para esse modelo. Para obter mais informações, consulte Um modelo de tarefas do operador personalizado..
(Opcional) Uma AWS KMS chave ARN se você quiser que a SageMaker IA criptografe a saída do seu trabalho de etiquetagem usando sua própria chave de AWS KMS criptografia em vez da chave de serviço padrão do Amazon S3.
(Opcional) Rótulos existentes para o conjunto de dados usados para o trabalho de rotulagem. Use essa opção se quiser que os operadores ajustem ou aprovem e rejeitem rótulos.
Se você quiser criar um trabalho de rotulagem de ajuste ou verificação, deve ter um arquivo de manifesto de saída no Amazon S3 que contenha os rótulos que você deseja ajustar ou verificar. Essa opção só tem suporte para trabalhos de rotulagem de imagens com caixa delimitadora e segmentação semântica, além de trabalhos de rotulagem de nuvem de pontos 3D e quadros de vídeo. É recomendável que você use as instruções Verificação e ajuste do rótulo para criar um trabalho de verificação ou ajuste de rotulagem.

Importante

Sua equipe de trabalho, arquivo de manifesto de entrada, bucket de saída e outros recursos no Amazon S3 devem estar na mesma AWS região que você usa para criar seu trabalho de etiquetagem.

Ao criar um trabalho de rotulagem usando o console de SageMaker IA, você adiciona instruções e rótulos do trabalhador à interface do usuário que a Ground Truth fornece. É possível visualizar e interagir com a interface do usuário do operador ao criar um trabalho de rotulagem no console. Você também pode ver uma prévia da interface do usuário do operador na sua página de tipo de tarefa integrada.

Como criar um trabalho de rotulagem (console)

Faça login no console de SageMaker IA em https://console.aws.amazon.com/sagemaker/.
No painel de navegação à esquerda, selecione Trabalhos de rotulagem.
Na página Trabalhos de rotulagem, selecione Criar trabalho de rotulagem.
Em Nome do trabalho, insira um nome para o trabalho de rotulagem.
(Opcional) Se quiser identificar os rótulos com uma chave, selecione Quero especificar um nome de atributo de rótulo diferente do nome do trabalho de rotulagem. Se você não selecionar essa opção, o nome do trabalho de rotulagem especificado na etapa anterior será usado para identificar os rótulos no arquivo de manifesto de saída.
Escolha uma configuração de dados para criar uma conexão entre seu conjunto de dados de entrada e o Ground Truth.
- Para configuração automatizada de dados:
  - Siga as instruções em Automatize a configuração de dados para trabalhos de rotulagem para tarefas de rotulagem de imagens, textos e videoclipes.
  - Siga as instruções em Configurar dados de entrada automatizados de quadros de vídeo para trabalhos de rotulagem de quadros de vídeo.
- Para configuração manual de dados:
  - Em Local do conjunto de dados de entrada, forneça o local no Amazon S3 onde o arquivo de manifesto de entrada está localizado. Por exemplo, se o arquivo de manifesto de entrada, manifest.json, estiver localizado em example-bucket, insira s3://example-bucket/manifest.json.
  - Em Local do conjunto de dados de saída, forneça o local do Amazon S3 onde você deseja que o Ground Truth armazene os dados de saída do trabalho de rotulagem.
Para a função do IAM, escolha uma função do IAM existente ou crie uma função do IAM com permissão para acessar seus recursos no Amazon S3, para gravar no bucket de saída do Amazon S3 especificado acima e com SageMaker uma política de execução de IA anexada.
(Opcional) Para configuração adicional, você pode especificar quanto do seu conjunto de dados deseja que os trabalhadores rotulem e se deseja que a SageMaker IA criptografe os dados de saída do seu trabalho de rotulagem usando uma chave de AWS KMS criptografia. Para criptografar seus dados de saída, você deve ter as AWS KMS permissões necessárias anexadas à função do IAM fornecida na etapa anterior. Consulte mais detalhes em Atribua permissões do IAM para usar o Ground Truth.
Na seção Tipo de tarefa, em Categoria da tarefa, use o menu suspenso para selecionar a categoria da tarefa.
Em Seleção de tarefas, escolha o tipo de tarefa.
(Opcional) Forneça tags para o trabalho de rotulagem a fim de facilitar sua localização no console posteriormente.
Escolha Próximo.
Na seção Operadores, escolha o tipo de força de trabalho que você gostaria de usar. Para obter mais detalhes sobre suas opções de força de trabalho, consulte Forças de trabalho.
Depois de selecionar a força de trabalho, especifique o Tempo limite da tarefa. Esse é o tempo máximo que um operador tem para trabalhar em uma tarefa.

Para tarefas de anotação em nuvem de pontos 3D, o tempo limite da tarefa padrão é de três dias. O tempo limite padrão para classificação de texto e imagem e trabalhos de rotulagem de verificação de rótulos é de cinco minutos. O tempo limite padrão para todos os outros trabalhos de rotulagem é de 60 minutos.
(Opcional) Para tipos de tarefas de caixa delimitadora, segmentação semântica, quadros de vídeo e nuvem de pontos 3D, você pode selecionar Exibir rótulos existentes se quiser exibir rótulos para o conjunto de dados de entrada a fim de que os operadores verifiquem ou ajustem.

Para trabalhos de rotulagem de caixa delimitadora e segmentação semântica, isso criará um trabalho de rotulagem de ajuste.

Para trabalhos de rotulagem de nuvem de pontos 3D e quadros de vídeo:
- Selecione Ajuste para criar uma tarefa de rotulagem de ajuste. Quando selecionar essa opção, você pode adicionar novos rótulos, mas não pode remover ou editar rótulos existentes do trabalho anterior. Opcionalmente, você pode escolher os atributos da categoria do rótulo e os atributos do quadro que deseja que os trabalhadores editem. Para tornar um atributo editável, marque a caixa de seleção Permitir que os trabalhadores editem esse atributo para esse atributo.
  
  Se preferir, você pode fornecer atributos da categoria de rótulo e do quadro.
- Selecione Verificação para criar um trabalho de rotulagem de ajuste. Quando selecionar essa opção, você não pode adicionar, modificar ou remover rótulos existentes do trabalho anterior. Se preferir, você pode escolher os atributos da categoria do rótulo e os atributos do quadro que deseja que os trabalhadores editem. Para tornar um atributo editável, marque a caixa de seleção Permitir que os trabalhadores editem esse atributo para esse atributo.
  
  Recomendamos que você adicione novos atributos de categoria de rótulo aos rótulos que deseja que os trabalhadores verifiquem ou adicione um ou mais atributos de quadro para que os trabalhadores forneçam informações sobre o quadro inteiro.
Para obter mais informações, consulte Verificação e ajuste do rótulo.
Configure a interface de usuário dos seus trabalhadores:
- Se estiver usando um tipo de tarefa integrado, especifique as instruções e os rótulos dos trabalhadores.
  - Para classificação de imagens e classificação de texto (rótulo único e múltiplos), você deve especificar pelo menos duas categorias de rótulos. Para todos os outros tipos de tarefas integradas, você deve especificar pelo menos uma categoria de rótulo.
  - (Opcional) Se estiver criando um trabalho de rotulagem de nuvem de pontos 3D ou quadro de vídeo, poderá especificar atributos de categoria de rótulo (não compatíveis com segmentação semântica de nuvem de pontos 3D) e atributos de quadro. Os atributos da categoria de rótulo podem ser atribuídos a um ou mais rótulos. Os atributos do quadro aparecerão em cada nuvem de pontos ou rótulo dos trabalhadores do quadro de vídeo. Para saber mais, consulte Interface do usuário (UI) do operador para a nuvem de pontos 3D e Interface do usuário (UI) do operador para o quadro de vídeo.
  - (Opcional) Adicione instruções adicionais para ajudar seu operador a concluir sua tarefa.
- Se estiver criando um fluxo de trabalho de rotulagem personalizado, deverá:
  - Inserir um modelo personalizado na caixa de código. Modelos personalizados podem ser criados usando uma combinação de HTML, a linguagem de modelagem Liquid e nossos componentes web pré-criados. Se preferir, você pode escolher o modelo base no menu suspenso para começar.
  - Especificar as funções do Lambda de pré-anotação e pós-anotação. Para saber como criar essas funções, consulte Processando dados em um fluxo de trabalho de rotulagem personalizado com AWS Lambda.
(Opcional) É possível selecionar Ver pré-visualização para visualizar as instruções do operador, os rótulos e interagir com a interface do usuário do operador. Certifique-se de que o bloqueador de pop-ups do navegador esteja desativado antes de gerar a pré-visualização.
Escolha Criar.

Depois de criar com êxito o trabalho de rotulagem, você será redirecionado para a página Trabalhos de rotulagem. O status do trabalho de rotulagem que você acabou de criar estará Em andamento. Esse status é atualizado progressivamente à medida que os operadores concluem as tarefas. Quando todas as tarefas forem concluídas com êxito, o status será alterado para Concluído.

Se ocorreu um problema durante a criação do trabalho de rotulagem, seu status será alterado para Falhou.

Para ver mais detalhes sobre o trabalho, selecione o nome do trabalho de rotulagem.

Próximas etapas

Depois que o status do trabalho de rotulagem mudar para Concluído, você poderá visualizar os dados de saída no bucket do Amazon S3 especificado durante a criação desse trabalho de rotulagem. Para obter detalhes sobre o formato dos dados de saída, consulte Rotulando dados de saída do trabalho.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Criar páginas de instrução

Criar um trabalho de rotulagem (API)