Come funziona il rilevamento oggetti

L'algoritmo di rilevamento oggetti identifica e individua tutte le istanze degli oggetti in un'immagine da una raccolta nota di categorie di oggetti. L'algoritmo accetta un'immagine come input e restituisce la categoria a cui appartiene l'oggetto, insieme a un punteggio di attendibilità che appartiene alla categoria. L'algoritmo prevede anche la posizione e la scala dell'oggetto con un riquadro di delimitazione rettangolare. Amazon SageMaker Object Detection utilizza l'algoritmo Single Shot multibox Detector (SSD) che utilizza come rete di base una rete neurale convoluzionale (CNN) preaddestrata per l'attività di classificazione. SSD utilizza l'output dei livelli intermedi come caratteristiche per il rilevamento.

Diverse CNN, come VGG, hanno ottenuto ottime prestazioni nell'attività di classificazione delle immagini. ResNet Il rilevamento di oggetti in Amazon SageMaker supporta sia VGG-16 che ResNet -50 come rete di base per SSD. L'algoritmo può essere addestrato in modalità completa o in modalità di trasferimento dell'apprendimento. Nella modalità di addestramento completo, la rete di base viene inizializzata con pesi casuali e preparata sui dati utente. In modalità di trasferimento dell'apprendimento, i pesi della rete di base sono caricati dai modelli già addestrati.

L'algoritmo di rilevamento degli oggetti utilizza operazioni di ottimizzazione dei dati standard, ad esempio capovolgimento, ridimensionamento e jitter in modo immediato internamente per evitare l'overfitting.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Rilevamento degli oggetti - MXNet

Iperparametri