Configuração automatizada de dados de entrada do quadro de vídeo - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configuração automatizada de dados de entrada do quadro de vídeo

É possível usar a configuração automatizada de dados do Ground Truth para detectar automaticamente arquivos de vídeo no bucket do Amazon S3 e extrair quadros de vídeo desses arquivos. Para saber como, consulte Fornecer arquivos de vídeo.

Se você já tem quadros de vídeo no Amazon S3, você pode usar a configuração automatizada de dados para usar esses quadros de vídeo em no trabalho de rotulagem. Para essa opção, todos os quadros de vídeo de um único vídeo devem ser armazenados usando um prefixo exclusivo. Para saber mais sobre os requisitos para usar essa opção, consulte Fornecer quadros de vídeo.

Selecione uma das seções a seguir para saber como configurar a conexão automática do conjunto de dados de entrada com o Ground Truth.

Use o procedimento a seguir para conectar os arquivos de vídeo ao Ground Truth e extrair automaticamente os quadros de vídeo desses arquivos para tarefas de detecção de objetos de quadro de vídeo e rotulagem de rastreamento de objetos.

nota

Se você usar a ferramenta do console de configuração automatizada de dados para extrair quadros de vídeo de mais de 10 arquivos de vídeo, precisará modificar o arquivo manifesto gerado pela ferramenta ou criar um novo para incluir 10 arquivos de sequência de quadros de vídeo ou menos. Para saber mais, consulte Fornecer arquivos de vídeo.

Certifique-se de que os arquivos de vídeo estejam armazenados em um bucket do Amazon S3 na mesma região da AWS em que você executa a configuração automatizada de dados.

Conecte automaticamente os arquivos de vídeo no Amazon S3 com o Ground Truth e extraia quadros de vídeo:
  1. Navegue até a página Criar trabalho de etiquetagem no SageMaker console da Amazon: https://console.aws.amazon.com/sagemaker/groundtruth.

    Os buckets S3 de entrada e saída devem estar localizados na mesma região da AWS em que você criou o trabalho de rotulagem. Esse link coloca você na região da Virgínia do Norte ( AWS us-east-1). Se os dados de entrada estiverem em um bucket do Amazon S3 em outra região, mude para essa região. Para alterar sua AWS região, na barra de navegação, escolha o nome da região exibida atualmente.

  2. Selecione Criar trabalho de rotulagem.

  3. Insira um nome de trabalho.

  4. Na seção Configuração de dados de entrada, selecione Configuração automatizada de dados.

  5. Insira um URI do Amazon S3 para a localização do S3 para conjuntos de dados de entrada. Um URI do S3 tem a seguinte aparência: s3://DOC-EXAMPLE-BUCKET/path-to-files/. Esse URI deve mostrar o local do Amazon S3 em que os arquivos de vídeo são armazenados.

  6. Especifique a localização no S3 para conjuntos de dados de saída. Esse é o local onde os dados de saída são armazenados. É possível optar por armazenar os dados de saída no Mesmo local do conjunto de dados de entrada ou Especificar novo local e inserir o URI do S3 do local em que deseja armazenar os dados de saída.

  7. Escolha Arquivos de vídeo para o tipo de dados usando a lista suspensa.

  8. Escolha Sim, extraia os quadros para tarefas de rastreamento e detecção de objetos.

  9. Escolha um método de extração de quadros.

    • Quando você escolhe Usar todos os quadros extraídos do vídeo para criar uma tarefa de rotulagem, o Ground Truth extrai todos os quadros de cada vídeo na localização do S3 para conjuntos de dados de entrada, até 2.000 quadros. Se um vídeo no conjunto de dados de entrada contiver mais de 2.000 quadros, os primeiros 2.000 serão extraídos e usados para essa tarefa de rotulagem.

    • Quando você escolhe Usar cada quadro x de um vídeo para criar uma tarefa de rotulagem, o Ground Truth extrai cada xésimo quadro de cada vídeo na localização do S3 para conjuntos de dados de entrada.

      Por exemplo, se o vídeo tiver 2 segundos de duração e uma taxa de quadros de 30 quadros por segundo, haverá 60 quadros no vídeo. Se você especificar 10 aqui, o Ground Truth extrairá cada 10.º quadro do vídeo. Isso significa que o 1.º, 10.º, 20.º, 30.º, 40.º, 50.º e 60.º quadros são extraídos.

  10. Escolha ou crie uma função de execução do IAM. Certifique-se de que essa função tenha permissão para acessar os locais do Amazon S3 para obter dados de entrada e saída especificados nas etapas 5 e 6.

  11. Selecione Configuração completa de dados.

Use o procedimento a seguir para conectar as sequências de quadros de vídeo ao Ground Truth para tarefas de detecção de objetos de quadro de vídeo e rotulagem de rastreamento de objetos.

Certifique-se de que os quadros de vídeo estejam armazenados em um bucket do Amazon S3 na mesma região da AWS em que você executa a configuração automatizada de dados. Cada sequência de quadros de vídeo deve ter um prefixo exclusivo. Por exemplo, se você tiver duas sequências armazenadas em s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/, cada uma deverá ter um prefixo exclusivo, como sequence1 e sequence2 e ambas devem estar localizadas diretamente abaixo do prefixo /sequences/. No exemplo acima, a localização dessas duas sequências é: s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/ e s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/.

Conecte automaticamente o quadro de vídeo no Amazon S3 com o Ground Truth:
  1. Navegue até a página Criar trabalho de etiquetagem no SageMaker console da Amazon: https://console.aws.amazon.com/sagemaker/groundtruth.

    Os buckets S3 de entrada e saída devem estar localizados na mesma região da AWS em que você criou o trabalho de rotulagem. Esse link coloca você na região da Virgínia do Norte ( AWS us-east-1). Se os dados de entrada estiverem em um bucket do Amazon S3 em outra região, mude para essa região. Para alterar sua AWS região, na barra de navegação, escolha o nome da região exibida atualmente.

  2. Selecione Criar trabalho de rotulagem.

  3. Insira um nome de trabalho.

  4. Na seção Configuração de dados de entrada, selecione Configuração automatizada de dados.

  5. Insira um URI do Amazon S3 para a localização do S3 para conjuntos de dados de entrada.

    Esse deve ser o local do Amazon S3 em que as sequências são armazenadas. Por exemplo, se você tiver duas sequências armazenadas em s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/, s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/, insira s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/ aqui.

  6. Especifique a localização no S3 para conjuntos de dados de saída. Esse é o local onde os dados de saída são armazenados. É possível optar por armazenar os dados de saída no Mesmo local do conjunto de dados de entrada ou Especificar novo local e inserir o URI do S3 do local em que deseja armazenar os dados de saída.

  7. Escolha quadros de vídeo para o tipo de dados usando a lista suspensa.

  8. Escolha ou crie uma função de execução do IAM. Certifique-se de que essa função tenha permissão para acessar os locais do Amazon S3 para obter dados de entrada e saída especificados nas etapas 5 e 6.

  9. Selecione Configuração completa de dados.

Esses procedimentos criarão um manifesto de entrada no local do Amazon S3 para conjuntos de dados de entrada que você especificou na etapa 5. Se você estiver criando um trabalho de rotulagem usando a SageMaker API ou um AWS SDK AWS CLI, use o URI do Amazon S3 para esse arquivo de manifesto de entrada como entrada para o parâmetro. ManifestS3Uri