Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Preparazione dei set di dati
La creazione di un adattatore richiede di fornire a Rekognition due set di dati, un set di dati di addestramento e un set di dati di test. Ogni set di dati è composto da due elementi: immagini e annotazioni/etichette. Le sezioni seguenti spiegano a cosa servono etichette e immagini e come si uniscono per creare set di dati.
Immagini
Dovrai addestrare un adattatore su esempi rappresentativi delle tue immagini. Quando selezionate le immagini per l'addestramento, provate a includere almeno alcune immagini che dimostrino la risposta prevista per ciascuna delle etichette che avete scelto come target con l'adattatore.
Per creare un set di dati di addestramento è necessario fornire uno dei due tipi di immagine seguenti:
-
Immagini con previsioni false positive. Ad esempio, quando un modello base prevede che un'immagine contenga alcol, ma non è così.
-
Immagini con previsioni false negative. Ad esempio, quando un modello base prevede che un'immagine non contenga alcol, ma in realtà ne contiene.
Per creare un set di dati bilanciato, si consiglia di fornire uno dei due tipi di immagine seguenti:
-
Immagini con previsioni vere positive. Ad esempio, quando un modello base prevede correttamente che un'immagine contenga alcol. Si consiglia di fornire queste immagini se si forniscono immagini false positive.
-
Immagini con previsioni vere negative. Ad esempio, quando un modello base prevede correttamente che un'immagine non contenga alcol. Si consiglia di fornire queste immagini se si forniscono immagini false negative.
Etichette
Un'etichetta si riferisce a uno qualsiasi dei seguenti elementi: oggetti, eventi, concetti o attività. Per moderazione dei contenuti, un'etichetta è un esempio di contenuto inappropriato, indesiderato o offensivo.
Nel contesto della creazione di un adattatore mediante l'addestramento del modello base di Rekognition, quando un'etichetta viene assegnata a un'immagine viene chiamata annotazione. Durante l'addestramento di un adattatore con la Rekognition Console, utilizzerai la Console per aggiungere annotazioni alle tue immagini scegliendo un'etichetta e quindi taggando le immagini che corrispondono all'etichetta. Attraverso questo processo, il modello impara a identificare gli elementi delle immagini in base all'etichetta assegnata. Questo processo di collegamento consente al modello di concentrarsi sui contenuti più pertinenti quando viene creato un adattatore, con conseguente maggiore precisione per l'analisi delle immagini.
In alternativa, è possibile fornire un file manifesto, che contiene informazioni sulle immagini e le relative annotazioni.
Allenare e testare set di dati
Il set di dati di addestramento è la base per la messa a punto del modello e la creazione di un adattatore personalizzato. È necessario fornire un set di dati di addestramento annotato da cui il modello possa imparare. Il modello impara da questo set di dati per migliorare le proprie prestazioni sul tipo di immagini fornite.
Per migliorare la precisione, è necessario creare il set di dati di allenamento mediante annotation/labeling immagini. Puoi farlo in due modi:
Assegnazione manuale delle etichette: puoi utilizzare la Rekognition Console per creare un set di dati di allenamento caricando le immagini che desideri contengano nel set di dati e quindi assegnando manualmente le etichette a queste immagini.
File manifest: è possibile utilizzare un file manifest per addestrare l'adattatore. Il file manifest contiene informazioni sulle annotazioni di base relative alle immagini di addestramento e test, nonché sulla posizione delle immagini di allenamento. È possibile fornire il file manifest durante l'addestramento di un adattatore utilizzando APIs Rekognition o quando si utilizza la Console. AWS
Il set di dati di test viene utilizzato per valutare le prestazioni dell'adattatore dopo l'allenamento. Per garantire una valutazione affidabile, il set di dati di test viene creato utilizzando una parte del set di dati di addestramento originale che il modello non ha mai visto prima. Questo processo garantisce che le prestazioni dell'adattatore vengano valutate con nuovi dati, creando misurazioni e metriche accurate. Per un miglioramento ottimale della precisione, consultare Best practice per l'addestramento degli adattatori.