Amazon Rekognition
Guía del desarrollador

Detección de texto

Amazon Rekognition Text in Image puede detectar texto en imágenes y convertirlo en texto legible por una máquina. Puede utilizar el texto legible por una máquina para implementar soluciones como, por ejemplo:

  • Búsqueda visual. Un ejemplo es recuperar y mostrar imágenes que contengan el mismo texto.

  • Información de contenido. Un ejemplo es proporcionar información sobre los temas que aparecen en el texto reconocido en fotogramas de vídeo extraídos. La aplicación puede realizar búsquedas de texto reconocido sobre contenido relevante—como, por ejemplo, noticias, puntuaciones deportivas, dorsales de deportista y titulares.

  • Navegación. Un ejemplo es el desarrollo de una app habilitada para voz para personas con problemas de visión que reconozca los nombres de restaurantes, tiendas o letreros de calles.

  • Soporte para seguridad pública y transporte. Un ejemplo es la detección de números de matrícula a partir de las imágenes de las cámaras de tráfico.

  • Filtrado. Un ejemplo es filtrar la información personalmente identificable a partir de imágenes.

DetectText detecta texto en imágenes con formato .jpeg o .png, y es compatible con la mayoría de las fuentes, incluso las muy estilizadas. Después de la detección de texto, DetectText crea una representación de las palabras y las líneas de texto detectadas, y muestra la relación entre ellas. El API DetectText le indica además dónde está el texto en una imagen.

Analice la siguiente imagen:

Los cuadros azules representan información sobre texto detectado y la ubicación del texto que devuelve la operación DetectText. Para detectarlo, el texto debe estar dentro de+/ - 90 grados orientación del eje horizontal. DetectText clasifica el texto reconocido bien como palabra o como línea de texto.

Una palabra consta de uno o varios caracteres en alfabeto latino básico ISO que no están separados por espacios. DetectText puede detectar hasta 50 palabras en una imagen.

Una línea es una cadena de palabras equidistantes. Una línea no es necesariamente una frase completa. Por ejemplo, un número de matrícula se detecta como una línea. Una línea finaliza cuando no hay texto alineado después de la misma. Además, una línea finaliza cuando existe un hueco grande entre las palabras, en relación con la longitud de las mismas. Esto significa, en función del hueco entre palabras, que Amazon Rekognition podría detectar varias líneas de texto alineado en la misma dirección. Los puntos no representan el final de una línea. Si una frase abarca varias líneas, la operación DetectText devuelve varias líneas.

Amazon Rekognition también puede detectar números y símbolos comunes como, por ejemplo, @, /, $, %, -, _, +,* y #.

Para ver un ejemplo, consulte Detección de texto en una imagen.