Cómo funciona la detección de objetos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cómo funciona la detección de objetos

El algoritmo de detección de objetos identifica y localiza todas las instancias de objetos en una imagen de un conjunto de categorías de objetos. El algoritmo toma una imagen como entrada y genera la categoría a la que pertenece el objeto, junto con una puntuación de confianza que pertenece a la categoría. El algoritmo también predice la ubicación y escala de cada objeto con un cuadro delimitador rectangular. La detección de objeto de Amazon SageMaker utiliza el algoritmo Single Shot multibox Detector (SSD) que toma una de red neuronal convolucional precapacitada (CNN) para la tarea de clasificación como la red de base. SSD utiliza la salida de capas intermedias como características para la detección.

Varias CNNs como VGG y ResNet han logrado un gran rendimiento en la tarea de clasificación de imágenes. Detección de objetos en Amazon SageMaker admite VGG-16 y ResNet-50 como red base para SSD. El algoritmo puede ser capacitado en modo de capacitación completa o en modo de aprendizaje de transferencia. En el modo de capacitación completa, la red base se inicializa con ponderaciones aleatorias y después se capacita con los datos de usuario. En el modo de aprendizaje de transferencia, las ponderaciones de la red base se cargan desde modelos capacitados previamente.

El algoritmo de detección de objetos utiliza operaciones de aumento de datos estándar, como, por ejemplo, flip, rescale y jittery sobre la marcha internamente para ayudar a evitar ajustes excesivos.