Détection de texte - Amazon Rekognition

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Détection de texte

Amazon Rekognition peut détecter du texte dans les images et les vidéos. Elle peut ensuite convertir le texte détecté en texte lisible par une machine. Vous pouvez utiliser la détection de texte lisible par une machine dans les images pour implémenter des solutions telles que :

  • Recherche visuelle. Par exemple, récupérer et afficher des images qui contiennent le même texte.

  • Informations des contenus. Par exemple : informations sur des thèmes qui reviennent dans le texte reconnu à l’intérieur des images vidéo extraites. Votre application peut rechercher des contenus pertinents dans le texte reconnu, par exemple des actualités, des résultats sportifs, des numéros d’athlètes et des sous-titres.

  • Navigation. Par exemple, le développement d’une application mobile vocale pour les personnes malvoyantes qui reconnaît les noms des restaurants et des magasins, ou les plaques de rue.

  • Prise en charge de la sécurité et des transports publics. Par exemple, détection des numéros de plaques minéralogiques sur des images de caméras de surveillance de la circulation.

  • Filtrage en cours. Par exemple, filtrage des données d'identification personnelle (PII) sur des images.

Pour la détection de texte dans les vidéos, vous pouvez implémenter des solutions telles que :

  • Recherche dans des vidéos de clips avec des mots clés spécifiques, tels que le nom de l’invité sur un graphique d’une émission d’actualités.

  • Modération du contenu pour garantir la conformité aux normes de l’organisation en détectant les textes inopinés, les grossièretés ou spams.

  • Recherche de toutes les superpositions de texte sur la chronologie vidéo pour un traitement ultérieur, comme le remplacement par du texte dans une autre langue pour l’internationalisation du contenu.

  • Recherche d’emplacements de texte pour que les autres graphiques puissent être alignés en conséquence.

Pour détecter du texte dans des images au format JPEG ou PNG, utilisez l'DetectTextopération. Pour détecter du texte de manière asynchrone dans une vidéo, utilisez les opérations StartTextDetectionet GetTextDetection. Les opérations de détection de texte d’image et de vidéo prennent en charge la plupart des polices, y compris les polices hautement stylisées. Après avoir détecté le texte, Amazon Rekognition crée une représentation des mots et des lignes de texte détectés, affiche la relation entre eux et vous indique où le texte se trouve sur une image ou un cadre vidéo.

Les opérations DetectText et GetTextDetection détectent les mots et les lignes. Un mot est un ou plusieurs caractères de script qui ne sont pas séparés par des espaces. DetectText peut détecter jusqu’à 100 mots dans une image. GetTextDetection peut également détecter jusqu’à 100 mots par image de vidéo.

Un mot est constitué d’un ou de plusieurs caractères qui ne sont pas séparés par des espaces. Amazon Rekognition est conçu pour détecter les mots en anglais, arabe, russe, allemand, français, italien, portugais et espagnol.

Une ligne est une chaîne de mots séparés par des espaces égaux. Une ligne n’est pas nécessairement une phrase complète (les points n’indiquent pas la fin d’une ligne). Par exemple, Amazon Rekognition détecte un numéro de permis de conduire comme étant une ligne. Une ligne se termine lorsqu’aucun texte n’est aligné après elle, ou lorsqu’il y a un grand écart entre les mots par rapport à la longueur des mots. En fonction de l’intervalle entre les mots, Amazon Rekognition peut détecter plusieurs lignes dans un texte aligné dans la même direction. Si une phrase s’étend sur plusieurs lignes, l’opération renvoie plusieurs lignes.

Examinez l’image suivante.

Tasse à café avec smiley et texte « It's Monday but keep smiling », avec encadrés et texte extrait.

Les cases bleues représentent des informations sur le texte détecté et son emplacement que l’opération DetectText renvoie. Dans cet exemple, Amazon Rekognition détecte « IT’s », « MONDAY », « but », « keep », et « Smiling » comme étant des mots. Amazon Rekognition détecte les phrases « IT’s », « MONDAY », « but », « keep », et « Smiling » sous forme de lignes. Pour être détecté, le texte doit avoir une orientation maximale de +/- 90 degrés par rapport à l’axe horizontal.

Pour obtenir un exemple, consultez Détection de texte sur une image.