As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Trabalhos de etiquetagem de streaming da Ground Truth
Se você quiser enviar perpetuamente novos objetos de dados para o Amazon SageMaker Ground Truth para serem rotulados, use uma tarefa de rotulagem de streaming. Os trabalhos de etiquetagem de streaming permitem que você:
-
Envie novos objetos do conjunto de dados aos trabalhadores em tempo real usando um trabalho de rotulagem em execução permanente. Os trabalhadores recebem continuamente novos objetos de dados para rotular, desde que a tarefa de rotulagem esteja ativa e novos objetos estejam sendo enviados a ela.
-
Obtenha visibilidade do número de objetos que foram colocados na fila e aguardam para serem rotulados. Use essas informações para controlar o fluxo de objetos de dados enviados para sua tarefa de etiquetagem.
-
Receba dados de etiquetas para objetos de dados individuais em tempo real à medida que os trabalhadores terminarem de rotulá-los.
As trabalhos de etiquetagem de streaming da Ground Truth permanecem ativas até serem interrompidas manualmente ou ficarem ociosas por mais de 10 dias. Você pode enviar intermitentemente novos objetos de dados aos trabalhadores enquanto a tarefa de rotulagem está ativa.
Se você for um novo usuário dos trabalhos de rotulagem de streaming da Ground Truth, é recomendável que você analise Como funciona.
Use Criar um trabalho de rotulagem de streaming para aprender a criar um trabalho de rotulagem de streaming.
nota
Os trabalhos de etiquetagem de streaming da Ground Truth são suportados apenas por meio do SageMaker API.
Como funciona
Quando você cria uma tarefa de rotulagem de streaming do Ground Truth, a tarefa permanece ativa até ser interrompida manualmente, permanece ociosa por mais de 10 dias ou não consegue acessar as fontes de dados de entrada. Você pode enviar intermitentemente novos objetos de dados aos trabalhadores enquanto eles estão ativos. Um trabalhador pode continuar recebendo novos objetos de dados em tempo real, desde que o número total de tarefas atualmente disponíveis para o trabalhador seja menor que o valor em MaxConcurrentTaskCount
. Caso contrário, o objeto de dados é enviado para uma fila que a Ground Truth cria em seu nome no Amazon Simple Queue Service SQS (Amazon) para processamento posterior. Essas tarefas são enviadas aos trabalhadores assim que o número total de tarefas atualmente disponíveis para um trabalhador ficar abaixo de MaxConcurrentTaskCount
. Se um objeto de dados não for enviado a um trabalhador após 14 dias, ele expirará. Você pode visualizar o número de tarefas pendentes na fila e ajustar o número de objetos enviados para o trabalho de etiquetagem. Por exemplo, você pode diminuir a velocidade com que envia objetos para a tarefa de etiquetagem se a lista de pendências de objetos pendentes ultrapassar um limite.