Preparazione delle immagini per un set di dati Creazione del set di dati

Creare il tuo set di dati

Un set di dati contiene le immagini e le etichette assegnate utilizzate per addestrare e testare un modello. Puoi creare il set di dati per il tuo progetto con la console Amazon Lookout for Vision o con CreateDatasetl'operazione. Le immagini del set di dati devono essere etichettate in base al tipo di modello che desideri creare (classificazione delle immagini o segmentazione delle immagini).

Argomenti

Preparazione delle immagini per un set di dati

È necessaria una raccolta di immagini per creare un set di dati. Le immagini devono essere PNG o JPEG formattare file. Il numero e il tipo di immagini necessarie dipendono dal fatto che il progetto abbia un unico set di dati o set di dati di formazione e test separati.

Progetto con set di dati singolo

Per creare un modello di classificazione delle immagini, è necessario quanto segue per iniziare la formazione:

Almeno 20 immagini di oggetti normali.
Almeno 10 immagini di oggetti anomali.

Per creare un modello di segmentazione delle immagini, è necessario quanto segue per iniziare la formazione:

Almeno 20 immagini per ogni tipo di anomalia.
Ogni immagine anomala (immagine con tipi di anomalia presenti) deve avere un solo tipo di anomalia.
Almeno 20 immagini di oggetti normali.

Progetto separato di set di dati di formazione e test

Per creare un modello di classificazione delle immagini, è necessario quanto segue:

Almeno 10 immagini di oggetti normali nel set di dati di addestramento.
Almeno 10 immagini di oggetti normali nel set di dati del test.
Almeno 10 immagini di oggetti anomali nel set di dati del test.

Per creare un modello di segmentazione delle immagini, è necessario quanto segue:

Ogni set di dati necessita di almeno 10 immagini per ogni tipo di anomalia.
Ogni immagine anomala (immagine con tipi di anomalia presenti) deve contenere solo un tipo di anomalia.
Ogni set di dati deve avere almeno 10 immagini di oggetti normali.

Per creare un modello di qualità superiore, utilizzate un numero di immagini superiore al minimo. Se stai creando un modello di segmentazione, ti consigliamo di includere immagini con più tipi di anomalie, ma queste non rientrano nel conteggio minimo di cui Lookout for Vision ha bisogno per iniziare la formazione.

Le immagini devono appartenere a un unico tipo di oggetto. Inoltre, è necessario disporre di condizioni di acquisizione delle immagini coerenti, come il posizionamento della fotocamera, l'illuminazione e la posa dell'oggetto.

Tutte le immagini nei set di dati di addestramento e test devono avere le stesse dimensioni. Successivamente, le immagini che analizzerai con il modello addestrato devono avere le stesse dimensioni delle immagini dei set di dati di addestramento e test. Per ulteriori informazioni, consulta Rilevamento di anomalie in un'immagine.

Tutte le immagini di addestramento e test devono essere immagini uniche, preferibilmente di oggetti unici. Le immagini normali devono catturare le normali variazioni dell'oggetto da analizzare. Le immagini anomale devono catturare un campione diversificato di anomalie.

Amazon Lookout for Vision fornisce immagini di esempio che puoi utilizzare. Per ulteriori informazioni, consulta set di dati di classificazione delle immagini.

Per i limiti delle immagini, consultaQuote in Amazon Lookout for Vision.

Creazione del set di dati

Quando crei il set di dati per il tuo progetto, scegli la configurazione iniziale del set di dati del progetto. Puoi anche scegliere da dove importare le immagini da Lookout for Vision.

Scelta della configurazione del set di dati per il progetto

Quando crei il primo set di dati del tuo progetto, scegli una delle seguenti configurazioni di set di dati:

Set di dati singolo: un singolo progetto di set di dati utilizza un unico set di dati per addestrare e testare il modello. L'utilizzo di un singolo set di dati semplifica la formazione lasciando che Amazon Lookout for Vision scelga le immagini di formazione e test. Durante la formazione, Amazon Lookout for Vision divide internamente il set di dati in un set di dati di addestramento e un set di dati di test. Non hai accesso ai set di dati suddivisi. Ti consigliamo di utilizzare un singolo progetto di set di dati per la maggior parte degli scenari.
Set di dati di addestramento e test separati: se desideri un controllo più preciso su formazione, test e ottimizzazione delle prestazioni, puoi configurare il progetto in modo che disponga di set di dati di formazione e test separati. Utilizza un set di dati di test separato se desideri controllare le immagini utilizzate per i test o se disponi già di un set di immagini di riferimento che desideri utilizzare.

Puoi aggiungere un set di dati di test a un singolo progetto di set di dati esistente. Il singolo set di dati diventa quindi il set di dati di addestramento. Se rimuovi il set di dati di test da un progetto con set di dati di addestramento e test separati, il progetto diventa un singolo progetto di set di dati. Per ulteriori informazioni, consulta Eliminazione di un set di dati.

Importazione di immagini

Quando crei un set di dati, scegli da dove importare le immagini. A seconda di come si importano le immagini, le immagini potrebbero già essere etichettate. Se le immagini non sono etichettate dopo aver creato il set di dati, vedi. Immagini etichettate

Puoi creare un set di dati e importarne le immagini in uno dei seguenti modi:

Importa immagini dal tuo computer locale. Le immagini non sono etichettate. Puoi aggiungere o etichettare utilizzando la console Lookout for Vision.
Importa immagini da un bucket S3. Amazon Lookout for Vision può classificare le immagini utilizzando i nomi delle cartelle per etichettare le immagini. Usalo normal per immagini normali. Utilizzare anomaly per immagini anomale. Non è possibile assegnare automaticamente etichette di segmentazione.
Importa un file manifest di Amazon SageMaker Ground Truth, che include immagini etichettate. Puoi creare e importare il tuo file manifest. Se hai molte immagini, prendi in considerazione l'utilizzo del servizio di etichettatura SageMaker Ground Truth. Quindi importi il file manifesto di output dal job Amazon SageMaker Ground Truth. Se necessario, puoi utilizzare la console Lookout for Vision per aggiungere o modificare etichette.

Se stai usando il AWS SDK, crei un set di dati con un file manifest di Amazon SageMaker Ground Truth. Per ulteriori informazioni, consulta Creazione di un set di dati utilizzando un file manifest di Amazon SageMaker Ground Truth.

Se, dopo aver creato il set di dati, le immagini sono etichettate, puoi addestrare il modello. Se le immagini non sono etichettate, aggiungete le etichette in base al tipo di modello che desiderate creare. Per ulteriori informazioni, consulta Immagini etichettate.

Puoi aggiungere altre immagini a un set di dati esistente. Per ulteriori informazioni, consulta Aggiungere immagini al set di dati.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Creare il tuo progetto

Computer locale