Creazione di un processo di etichettatura (console) - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un processo di etichettatura (console)

Puoi utilizzare la SageMaker console Amazon per creare un processo di etichettatura per tutti i tipi di attività integrati di Ground Truth e i flussi di lavoro di etichettatura personalizzati. Per i tipi di attività predefiniti, consigliamo di utilizzare questa pagina insieme alla pagina per il tipo di attività. Ogni pagina relativa al tipo di attività include dettagli specifici sulla creazione di un processo di etichettatura utilizzando quel tipo di attività.

È necessario fornire quanto segue per creare un processo di etichettatura nella console: SageMaker

  • Un file manifest di input in Amazon S3. Puoi inserire il tuo set di dati di input in Amazon S3 e generare automaticamente un file manifest utilizzando la console Ground Truth (non supportata per i processi di etichettatura di nuvole di punti 3D).

    In alternativa, puoi creare manualmente un file manifest di input. Per scoprire come, consulta Dati di input.

  • Un bucket Amazon S3 per memorizzare i dati di output.

  • Un ruolo IAM con autorizzazione ad accedere alle tue risorse in Amazon S3 e con una policy di SageMaker esecuzione allegata. Per una soluzione generale, puoi allegare la policy gestita a un ruolo IAM e includerla sagemaker nel nome del bucket. AmazonSageMakerFullAccess

    Per policy più granulari, consulta Assegna IAM le autorizzazioni per utilizzare Ground Truth.

    Per i tipi di attività con nuvola di punti 3D vi sono ulteriori considerazioni sulla sicurezza. Ulteriori informazioni.

  • Un team di lavoro. Crei un team di lavoro da una forza lavoro composta da lavoratori, fornitori o dipendenti privati di Amazon Mechanical Turk. Per saperne di più, consulta Creare e gestire le forze lavoro.

    Non puoi utilizzare la forza lavoro Mechanical Turk per i lavori di etichettatura della nuvola di punti 3D o di fotogrammi video.

  • Se utilizzi un flusso di lavoro di etichettatura personalizzato, devi salvare un modello di attività di worker in Amazon S3 e fornire un URI Amazon S3 per tale modello. Per ulteriori informazioni, consulta Fase 2: creazione di un modello di attività del worker personalizzato.

  • (Facoltativo) Una AWS KMS chiave ARN se desideri SageMaker crittografare l'output del tuo processo di etichettatura utilizzando la tua chiave di AWS KMS crittografia anziché la chiave di servizio Amazon S3 predefinita.

  • (Facoltativo) Etichette esistenti per il set di dati utilizzato per il processo di etichettatura. Utilizzare questa opzione se si desidera che i lavoratori adeguino, approvino e rifiutino le etichette.

  • Se desideri creare un processo di etichettatura di regolazione o verifica, devi disporre di un file manifest di output in Amazon S3 che contenga le etichette che desideri modificare o verificare. Questa opzione è supportata solo per i processi di etichettatura di immagini con riquadri di delimitazione e segmentazione semantica e per i processi di etichettatura di nuvole di punti 3D e fotogrammi video. Si consiglia di utilizzare le istruzioni in Verifica e regolazione delle etichette per creare un processo di etichettatura di verifica o regolazione.

Importante

Il team di lavoro, il file manifesto di input, il bucket di output e altre risorse in Amazon S3 devono trovarsi nella AWS stessa regione utilizzata per creare il processo di etichettatura.

Quando crei un lavoro di etichettatura utilizzando la SageMaker console, aggiungi istruzioni ed etichette per l'operatore all'interfaccia utente fornita da Ground Truth. Puoi visualizzare in anteprima e interagire con l'interfaccia utente del lavoratore quando crei un processo di etichettatura nella console. Puoi anche vedere un'anteprima dell'interfaccia utente del lavoratore nella pagina dei tipi di attività integrata.

Per creare un processo di etichettatura (console)
  1. Accedi alla SageMaker console all'indirizzo https://console.aws.amazon.com/sagemaker/.

  2. Nel riquadro di navigazione sinistro, scegliere Processi di etichettatura.

  3. Nella pagina Processi di etichettatura scegliere Crea processo di etichettatura.

  4. In Nome processo, immettere un nome per il processo di etichettatura.

  5. (Facoltativo) Se si desidera identificare le etichette con una chiave, selezionare Desidero specificare un nome attributo etichetta diverso dal nome del processo di etichettatura. Se non si seleziona questa opzione, il nome del processo di etichettatura specificato nel passaggio precedente verrà utilizzato per identificare le etichette nel file manifest di output.

  6. Scegli una configurazione dei dati per creare una connessione tra il set di dati di input e Ground Truth.

    • Per la configurazione automatica dei dati:

    • Per la Configurazione manuale dei dati:

      • Per la Posizione del set di dati di input, specifica la posizione in Amazon S3 in cui si trova il file manifest di input. Ad esempio, se il file manifest di input, manifest.json, si trova in example-bucket, immetti s3://example-bucket/manifest.json.

      • Per la Posizione del set di dati di output, specifica la posizione in Amazon S3 in cui desideri che Ground Truth memorizzi i dati di output del processo di etichettatura.

  7. Per IAM Role, scegli un ruolo IAM esistente o crea un ruolo IAM con il permesso di accedere alle tue risorse in Amazon S3, di scrivere nel bucket di output Amazon S3 specificato sopra e con SageMaker una policy di esecuzione allegata.

  8. (Facoltativo) Per la configurazione aggiuntiva, puoi specificare la quantità del tuo set di dati che desideri che i lavoratori etichettino e se desideri SageMaker crittografare i dati di output per il tuo lavoro di etichettatura utilizzando una chiave di crittografia. AWS KMS Per crittografare i dati di output, è necessario disporre delle AWS KMS autorizzazioni richieste associate al ruolo IAM fornito nel passaggio precedente. Per ulteriori dettagli, consulta Assegna IAM le autorizzazioni per utilizzare Ground Truth.

  9. Nella sezione Tipo di attività in Categoria attività utilizza il menu a discesa per selezionare la categoria di attività.

  10. In Selezione attività, scegliere il tipo di attività desiderato.

  11. (Facoltativo) Fornire i tag per il processo di etichettatura per facilitarne la ricerca nella console in un secondo momento.

  12. Selezionare Successivo.

  13. Nella sezione Lavoratori scegliere il tipo di forza lavoro che si desidera utilizzare. Per ulteriori dettagli sulle opzioni della forza lavoro, consulta Creare e gestire le forze lavoro.

  14. (Facoltativo) Dopo aver selezionato la forza lavoro, specificare il timeout attività. Si tratta della quantità massima di tempo che un lavoratore ha per lavorare su un'attività.

    Per le attività di annotazione della nuvola di punti 3D, il timeout predefinito dell'attività è di 3 giorni. Il timeout predefinito per la classificazione del testo e delle immagini e i processi di etichettatura di verifica delle etichette sono di 5 minuti. Il timeout predefinito per tutti gli altri tipi di attività dei processi di etichettatura è di 60 minuti.

  15. (Facoltativo) Per i tipi di attività del riquadro di delimitazione, della segmentazione semantica, del fotogramma video e della nuvola di punti 3D, puoi selezionare Visualizza etichette esistenti se desideri visualizzare etichette per il set di dati di input per consentire ai lavoratori di verificare o modificare.

    Per i processi di etichettatura con riquadri di delimitazione e segmentazione semantica, ciò creerà un processo di etichettatura di regolazione.

    Per processi di etichettatura con nuvole di punti 3D e fotogrammi video:

    • Seleziona Regolazione per creare un processo di etichettatura di regolazione. Quando selezioni questa opzione, puoi aggiungere nuove etichette ma non puoi rimuovere o modificare le etichette esistenti dal processo precedente. Facoltativamente, puoi scegliere gli attributi delle categorie delle etichette e gli attributi dei fotogrammi che desideri che i lavoratori modifichino. Per rendere modificabile un attributo, seleziona la casella di controllo Consenti ai lavoratori di modificare questo attributo per quell'attributo.

      Facoltativamente puoi aggiungere una nuova categoria di etichetta e gli attributi del fotogramma.

    • Seleziona Verifica per creare un processo di etichettatura di regolazione. Quando selezioni questa opzione, puoi aggiungere, modificare o rimuovere etichette esistenti dal processo precedente. Facoltativamente, puoi scegliere gli attributi delle categorie delle etichette e gli attributi dei fotogrammi che desideri che i lavoratori modifichino. Per rendere modificabile un attributo, seleziona la casella di controllo Consenti ai lavoratori di modificare questo attributo per quell'attributo.

      Ti consigliamo di aggiungere nuovi attributi di categoria alle etichette che desideri che i lavoratori verifichino o di aggiungere uno o più attributi del fotogramma per consentire ai lavoratori di fornire informazioni sull'intero fotogramma.

    Per ulteriori informazioni, consulta Verifica e regolazione delle etichette.

  16. Configura l'interfaccia utente dei tuoi lavoratori:

    • Se utilizzi un tipo di attività integrato, specifica le istruzioni e le etichette dei lavoratori.

      • Per la classificazione delle immagini e del testo (etichetta singola e multipla) devi specificare almeno due categorie di etichette. Per tutti gli altri tipi di attività predefiniti, devi specificare almeno una categoria di etichette.

      • (Facoltativo) Se stai creando un processo di etichettatura di nuvole di punti 3D o fotogrammi video, puoi specificare gli attributi delle categorie di etichette (non supportati per la segmentazione semantica della nuvola di punti 3D) e gli attributi dei fotogrammi. Gli attributi delle categorie di etichette possono essere assegnati a una o più etichette. Gli attributi del fotogramma verranno visualizzati su ciascuna nuvola di punti o etichetta dei lavoratori del fotogramma video. Per ulteriori informazioni, consulta Interfaccia utente del lavoratore per la nuvola di punti 3D e Interfaccia utente del worker per i fotogrammi video.

      • (Facoltativo) Aggiungi Istruzioni aggiuntive per aiutare il lavoratore a completare l'attività.

    • Se stai creando un flusso di lavoro di etichettatura personalizzato, devi:

      • Inserire un modello personalizzato nella casella del codice. I modelli personalizzati possono essere creati utilizzando una combinazione di HTML, il linguaggio di template Liquid e i nostri componenti web predefiniti. Facoltativamente, puoi scegliere un modello di base dal menu a discesa per iniziare.

      • Specifica le funzioni lambda di pre-annotazione e post-annotazione. Per informazioni su come creare queste funzioni, consulta Fase 3: Elaborazione con AWS Lambda.

  17. (Facoltativo) Puoi selezionare Visualizza anteprima per visualizzare in anteprima le istruzioni del lavoratore, le etichette e interagire con l'interfaccia utente del lavoratore. Assicurati che il blocco pop-up del browser sia disabilitato prima di generare l'anteprima.

  18. Scegli Crea.

Dopo aver creato correttamente il processo di etichettatura, si viene reindirizzati alla pagina Processi di etichettatura. Lo stato del processo di etichettatura appena creato è In corso. Questo stato viene aggiornato progressivamente quando i lavoratori completano le attività. Quando tutte le attività sono state completate correttamente, lo stato viene modificato in Completato.

Se si verifica un problema durante la creazione del processo di etichettatura, lo stato cambia in Non riuscito.

Per visualizzare ulteriori dettagli sul processo, scegliere il nome del processo di etichettatura.

Fasi successive

Dopo aver modificato lo stato del processo di etichettatura in Completato, puoi visualizzare i dati di output nel bucket Amazon S3 specificato durante la creazione del processo di etichettatura. Per ulteriori informazioni sul formato dei dati di output, consulta Dati di output.