Detección de texto - Amazon Rekognition

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Detección de texto

Amazon Rekognition puede detectar texto en imágenes y vídeos. A continuación, puede convertir el texto detectado en texto legible por una máquina. Puede utilizar la detección de texto legible por una máquina en imágenes para implementar soluciones como:

  • Búsqueda visual. Por ejemplo, recuperar y mostrar imágenes que contengan el mismo texto.

  • Información de contenido. Por ejemplo, proporcionar información sobre los temas que aparecen en el texto reconocido en fotogramas de vídeo extraídos. La aplicación puede realizar búsquedas de texto reconocido sobre contenido relevante como, por ejemplo, noticias, puntuaciones deportivas, dorsales de deportista y titulares.

  • Navegación. Por ejemplo, el desarrollo de una app habilitada para voz para personas con problemas de visión que reconozca los nombres de restaurantes, tiendas o letreros de calles.

  • Soporte para seguridad pública y transporte. Por ejemplo, la detección de números de matrícula a partir de imágenes de cámaras de tráfico.

  • Filtrado. Por ejemplo, filtrado de información de identificación personal (PII) de imágenes.

Para la detección de texto en vídeos, puede implementar soluciones como:

  • Búsqueda de vídeos en busca de clips con palabras clave de texto específicas, como el nombre de un invitado en un gráfico de un programa de noticias.

  • Moderar el contenido para cumplir con los estándares de la organización mediante la detección de texto accidental, blasfemia o spam.

  • Búsqueda de todas las superposiciones de texto en la línea temporal del vídeo para su posterior procesamiento, como la sustitución del texto por texto en otro idioma para la internacionalización del contenido.

  • Búsqueda de ubicaciones de texto, de modo que otros gráficos se puedan alinear según corresponda.

Para detectar texto en imágenes en formato JPEG o PNG, utilice la DetectText . Para detectar texto de forma asíncrona en vídeo, utilice la herramienta StartTextDetection y GetTextDetection operaciones. Las operaciones de detección de texto de imagen y de vídeo admiten la mayoría de las fuentes, incluidas las que tienen un estilo muy estilizado. Después de detectar texto, Amazon Rekognition crea una representación de palabras y líneas de texto detectadas, muestra la relación entre ellas y le indica dónde está el texto en una imagen o fotograma de vídeo.

LaDetectTextyGetTextDetectionLas operaciones detectan palabras y líneas. ApalabraCada uno de los caracteres en alfabeto latino estándar ISO del alfabeto inglés estándar y los símbolos ASCII que no están separados por espacios.DetectTextpuede detectar hasta 100 palabras en una imagen.GetTextDetectionpuede detectar hasta 50 palabras por fotograma de vídeo. En la siguiente tabla se enumeran los caracteres que Amazon Rekognition puede detectar.

Categoría

Caracteres admitidos

Letras mayúsculas

ABCDEFGHIJKLMNOPQRSTUVWXYZ

Letras minúsculas

abcdefghijklmnopqrstuvwxyz

Números

0123456789

Símbolos ! " # $ % & \ ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~

Amazon Rekognition está diseñado para detectar palabras en inglés. También puede detectar palabras en otros idiomas que usan estos caracteres, pero no detecta diacríticos ni otros caracteres. Por ejemplo, puede detectar «un» en francés, pero es posible que no detecte «garçon» o que no lo detecte correctamente.

Una línea es una cadena de palabras equidistantes. Una línea no es necesariamente una frase completa (los puntos no indican el final de una línea). Por ejemplo, Amazon Rekognition detecta un número de licencia de conducir como una línea. Una línea finaliza cuando no hay texto alineado después o cuando existe un hueco grande entre las palabras, en relación con la longitud de las mismas. Dependiendo de la brecha entre las palabras, Amazon Rekognitionpodría detectar varias líneas de texto alineado en la misma dirección. Si una frase abarca varias líneas, la operación devuelve varias líneas.

Considere la siguiente imagen.

Los cuadros azules representan información sobre texto detectado y la ubicación del texto devuelto por elDetectText. En este ejemplo, Amazon Rekognition detecta palabras «IT'S», «but», «but», «keep» y «Smiling» como palabras. Amazon Rekognition detecta «IT's», «MONDAY», «but keep» y «Smiling» como líneas. Para ser detectado, el texto debe serDentro de una orientación de +/- 90° grados respecto al eje horizontal.

Para ver un ejemplo, consulte .Detección de texto en una imagen.