Scegli file video o fotogrammi video per i dati di input - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Scegli file video o fotogrammi video per i dati di input

Quando crei un lavoro di rilevamento di oggetti o di tracciamento di oggetti con frame video, puoi fornire una sequenza di fotogrammi video (immagini) oppure puoi utilizzare la SageMaker console Amazon per fare in modo che Ground Truth estragga automaticamente i fotogrammi video dai tuoi file video. Utilizza le seguenti sezioni per avere ulteriori informazioni su queste opzioni.

Fornire fotogrammi video

I fotogrammi video sono sequenze di immagini estratte da un file video. È possibile creare un processo di etichettatura Ground Truth per consentire ai worker di etichettare più sequenze di fotogrammi video. Ogni sequenza è composta da immagini estratte da un singolo video.

Per creare un processo di etichettatura utilizzando sequenze di fotogrammi video, devi memorizzare ogni sequenza utilizzando un prefisso di nome chiave univoco in Amazon S3. Nella console di Amazon S3, i prefissi dei nomi sono cartelle. Pertanto, nella console Amazon S3, ogni sequenza di fotogrammi video deve trovarsi nella propria cartella in Amazon S3.

Ad esempio, se disponi di due sequenze di fotogrammi video, puoi utilizzare i prefissi dei nomi chiave sequence1/ e sequence2/ per identificare le sequenze. In questo esempio, le sequenze possono trovarsi in s3://amzn-s3-demo-bucket/video-frames/sequence1/ e s3://amzn-s3-demo-bucket/video-frames/sequence2/.

Se utilizzi la console Ground Truth per creare un file manifesto di input, tutti i prefissi dei nomi delle chiavi di sequenza devono trovarsi nella stessa posizione in Amazon S3. Ad esempio, nella console Amazon S3, ciascuna sequenza potrebbe essere in una cartella in s3://amzn-s3-demo-bucket/video-frames/. In questo esempio, la prima sequenza di fotogrammi video (immagini) potrebbe trovarsi in s3://amzn-s3-demo-bucket/video-frames/sequence1/ e la seconda sequenza potrebbe trovarsi in s3://amzn-s3-demo-bucket/video-frames/sequence2/.

Importante

Anche se disponi di una sola sequenza di fotogrammi video che desideri che i worker etichettino, tale sequenza deve avere un prefisso del nome chiave in Amazon S3. Se utilizzi la console Amazon S3, significa che la sequenza si trova in una cartella. Essa non può trovarsi nella radice del bucket S3.

Quando si creano attività di worker utilizzando sequenze di fotogrammi video, Ground Truth utilizza una sequenza per attività. In ogni attività, Ground Truth ordina i fotogrammi video utilizzando l'ordine binario UTF-8.

Ad esempio, i fotogrammi video potrebbero essere nell'ordine seguente in Amazon S3:

[0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg]

Sono disposti nello stesso ordine nell'attività del worker: 0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg.

I fotogrammi possono anche essere ordinati utilizzando una convenzione di denominazione come la seguente:

[frame1.jpg, frame2.jpg, ..., frame11.jpg]

In questo caso, frame10.jpg e frame11.jpg precedono frame2.jpg nell’attività del worker. Il worker vede i tuoi fotogrammi video nel seguente ordine: frame1.jpg, frame10.jpg, frame11.jpg, frame2.jpg, ..., frame9.jpg.

Fornire file video

È possibile utilizzare la funzione di suddivisione dei fotogrammi di Ground Truth quando si crea un nuovo lavoro di etichettatura nella console per estrarre i fotogrammi video dai file video (MP4file). Una serie di fotogrammi video estratti da un singolo file video viene definita sequenza di frame video.

Puoi fare in modo che Ground Truth estragga automaticamente tutti i fotogrammi, fino a 2.000, dal video oppure puoi specificare una frequenza per l'estrazione di fotogrammi. Ad esempio, puoi fare in modo che Ground Truth estragga ogni 10o fotogramma dai tuoi video.

Puoi fornire fino a 50 video utilizzando la configurazione automatica dei dati per estrarre i fotogrammi; tuttavia, il file manifesto di input non può fare riferimento a più di 10 file di sequenza di fotogrammi video quando crei un processo di etichettatura di oggetti con fotogrammi video e di rilevamento di oggetti con fotogrammi video. Se utilizzi lo strumento console di configurazione automatica dei dati per estrarre fotogrammi video da più di 10 file video, dovrai modificare il file manifesto generato dallo strumento oppure crearne uno nuovo per includere al massimo 10 file di sequenza di fotogrammi video. Per ulteriori informazioni su queste quote, vedi Quote del processo di etichettatura di nuvole di punti 3D e frame video.

Per utilizzare lo strumento di estrazione dei fotogrammi video, consulta Configura i dati di input automatici dei fotogrammi video.

Quando tutti i fotogrammi video sono stati estratti con successo dai tuoi video, nella posizione del set di dati di input S3 vedrai quanto segue:

  • Un prefisso del nome chiave (una cartella nella console Amazon S3) il cui nome viene assegnato dopo ogni video. Ciascuno di questi prefissi porta a:

    • Una sequenza di fotogrammi video estratti dal video utilizzata per denominare quel prefisso.

    • Un file di sequenza utilizzato per identificare tutte le immagini che compongono la sequenza.

  • Un file manifesto di input con estensione .manifest. Questo identifica tutti i file di sequenza che verranno utilizzati per creare il processo di etichettatura.

Tutti i fotogrammi estratti da un singolo file video vengono utilizzati per un'attività di etichettatura. Se estrai fotogrammi video da più file video, vengono create più attività per il processo di etichettatura, una per ogni sequenza di fotogrammi video.

Ground Truth archivia ogni sequenza di fotogrammi video che estrae nella posizione Amazon S3 per i set di dati di input utilizzando un prefisso di nome chiave univoco. Nella console di Amazon S3, i prefissi dei nomi sono cartelle.