Fonctionnement de la détection d'objet - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Fonctionnement de la détection d'objet

L'algorithme de détection d'objet identifie et localise toutes les instances d'objets dans une image à partir d'un ensemble connu de catégories d'objets. L'algorithme accepte une image comme entrée et génère la catégorie à laquelle l'objet appartient, ainsi qu'un score de fiabilité qu'il appartient à la catégorie. L'algorithme prédit également l'emplacement de l'objet et le met à l'échelle avec un cadre de délimitation rectangulaire. La détection d'objet Amazon SageMaker utilise l'algorithme SSD (Single Shot multibox Detector) qui accepte un réseau neuronal convolutif préentraîné pour la tâche de classification comme réseau de base. SSD utilise la sortie des couches intermédiaires comme caractéristiques pour la détection.

Les divers réseaux neuronaux convolutifs comme VGG et ResNet ont obtenu des performances élevées sur la tâche de classification d'images. La détection d'objet dans Amazon SageMaker prend en charge à la fois VGG-16 et ResNet-50 en tant que réseau de base pour l'algorithme SSD. L'algorithme peut être entraîné en mode d'entraînement complet ou mode de formation de transfert. En mode d'entraînement complet, le réseau de base est initialisé avec des pondérations aléatoires, puis entraîné sur les données utilisateur. En mode de formation de transfert, les pondérations du réseau de base sont chargées à partir des modèles préentraînés.

L'algorithme de détection d'objet utilise les opérations standard d'augmentation des données, telles que Flip, Rescale et Jitter, à la volée et en interne afin d'éviter un surajustement.