Fonctionnement de la détection d'objet

L'algorithme de détection d'objet identifie et localise toutes les instances d'objets dans une image à partir d'un ensemble connu de catégories d'objets. L'algorithme accepte une image comme entrée et génère la catégorie à laquelle l'objet appartient, ainsi qu'un score de fiabilité qu'il appartient à la catégorie. L'algorithme prédit également l'emplacement de l'objet et le met à l'échelle avec un cadre de délimitation rectangulaire. Amazon SageMaker Object Detection utilise l'algorithme Single Shot multibox Detector (SSD) qui utilise un réseau neuronal convolutionnel (CNN) préentraîné pour la tâche de classification comme réseau de base. SSD utilise la sortie des couches intermédiaires comme caractéristiques pour la détection.

Divers CNN tels que VGG ResNetont obtenu d'excellentes performances en matière de classification d'images. La détection d'objets sur Amazon SageMaker prend en charge à la fois le VGG-16 et le ResNet VGG-50 en tant que réseau de base pour les SSD. L'algorithme peut être entraîné en mode d'entraînement complet ou mode de formation de transfert. En mode d'entraînement complet, le réseau de base est initialisé avec des pondérations aléatoires, puis entraîné sur les données utilisateur. En mode de formation de transfert, les pondérations du réseau de base sont chargées à partir des modèles préentraînés.

L'algorithme de détection d'objet utilise les opérations standard d'augmentation des données, telles que Flip, Rescale et Jitter, à la volée et en interne afin d'éviter un surajustement.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Détection d'objets : MXNet

Hyperparamètres