Configuração manual de dados de entrada - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configuração manual de dados de entrada

Escolha a opção de configuração manual de dados se você tiver criado arquivos de sequência para cada uma das sequências de quadros de vídeo e um arquivo manifesto listando referências a esses arquivos de sequências.

Criar um arquivo manifesto de entrada de quadros de vídeo

O Ground Truth usa o arquivo manifesto de entrada para identificar a localização do conjunto de dados de entrada ao criar tarefas de rotulagem. Para trabalhos de detecção de objetos de quadro de vídeo e rotulagem de rastreamento de objetos, cada linha no arquivo manifesto de entrada identifica a localização de um arquivo de sequência de quadros de vídeo. Cada arquivo de sequência identifica as imagens incluídas em uma única sequência de quadros de vídeo.

Use esta página para aprender como criar um arquivo de sequência de quadros de vídeo e um arquivo manifesto de entrada para trabalhos de rastreamento de objetos de quadro de vídeo e rotulagem de detecção de objetos.

Se você quiser que o Ground Truth gere automaticamente os arquivos de sequência e arquivo manifesto de entrada, consulte Configuração automatizada de dados de entrada do quadro de vídeo.

Criar um manifesto de entrada de sequência de quadros de vídeo

No arquivo manifesto de entrada da sequência de quadros de vídeo, cada linha no manifesto é um objeto JSON, com uma chave "source-ref" que faz referência a um arquivo de sequência. Cada arquivo de sequência identifica a localização de uma sequência de quadros de vídeo. Essa é a formatação do arquivo manifesto necessária para todos os trabalhos de rotulagem de quadros de vídeo.

O exemplo a seguir demonstra a sintaxe usada para um arquivo manifesto de entrada.

{"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq1.json"} {"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq2.json"}

Criar um arquivo de sequência de quadros de vídeo

Os dados de cada sequência de quadros de vídeos precisam ser armazenados em um objeto de dados JSON. Veja a seguir um exemplo do formato utilizado para um arquivo de sequência. As informações sobre cada quadro são incluídas como um objeto JSON e estão relacionadas na lista frames. O objeto JSON foi expandido para facilitar a leitura

{ "seq-no": 1, "prefix": "s3://mybucket/prefix/video1/", "number-of-frames": 3, "frames":[ {"frame-no": 1, "unix-timestamp": 1566861644, "frame": "frame0001.jpg" }, {"frame-no": 2, "unix-timestamp": 1566861644, "frame": "frame0002.jpg" }, {"frame-no": 3, "unix-timestamp": 1566861644, "frame": "frame0003.jpg" } ] }

A tabela a seguir fornece detalhes sobre os parâmetros mostrados no exemplo desse código.

Parâmetro

Obrigatório

Valores aceitos

Descrição

seq-no

Sim

Inteiro

O número ordenado da sequência.

prefix

Sim

String

Valores aceitos:

s3://<bucket-name>/<prefix>/

O local do Amazon S3 onde os arquivos de sequência estão localizados.

O prefixo deve terminar com uma barra: /.

number-of-frames

Sim

Inteiro

O número total de quadros incluídos no arquivo de sequência. Esse número deve corresponder ao número total de quadros listados no parâmetro frames na próxima linha.

frames

Sim

Lista de objetos JSON

Obrigatório:

frame-no, frame

Opcional:

unix-timestamp

Uma lista de dados de quadros. O comprimento da lista deve ser igual ao number-of-frames. Na interface do usuário do operador, os quadros em uma sequência são ordenados na ordem binária UTF-8. Para saber mais sobre essa ordem, consulte Fornecer quadros de vídeo.

frame-no

Sim

Inteiro

O número do pedido do quadro. Isso determinará a ordem de um quadro na sequência.

unix-timestamp

Não

Inteiro

O carimbo de data/hora de unix de um quadro. O número de segundos desde 1º. de janeiro de 1970 até o horário UTC em que o quadro foi capturado.

frame

Sim

String

O nome de um arquivo de imagem de quadro de vídeo.