Detección de texto - Amazon Rekognition

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Detección de texto

Amazon Rekognition puede detectar texto en imágenes y vídeos. A continuación, puede convertir el texto detectado en texto legible por una máquina. Puede utilizar la detección de texto legible por una máquina en imágenes para implementar soluciones como:

  • Búsqueda visual. Por ejemplo, recuperar y mostrar imágenes que contengan el mismo texto.

  • Información de contenido. Por ejemplo, proporcionar información sobre los temas que aparecen en el texto reconocido en fotogramas de vídeo extraídos. La aplicación puede realizar búsquedas de texto reconocido sobre contenido relevante como, por ejemplo, noticias, puntuaciones deportivas, dorsales de deportista y titulares.

  • Navegación. Por ejemplo, el desarrollo de una app mediante diálogos para personas con problemas de visión que reconozca los nombres de restaurantes, tiendas o letreros de calles.

  • Soporte para seguridad pública y transporte. Por ejemplo, la detección de números de matrícula de imágenes de cámaras de tráfico.

  • Filtrado. Por ejemplo, filtrado de información de identificación personal (PII) a partir de imágenes.

Para la detección de texto en vídeos, puede implementar soluciones como:

  • Búsqueda de vídeos para clips donde se muestren las palabras clave de texto específicas, como el nombre del invitado en un gráfico en un programa de noticias.

  • Moderación del contenido para cumplir con los estándares de la organización mediante la detección de texto accidental, blasfemias o spam.

  • Búsqueda de todas las superposiciones de texto en la línea temporal del vídeo para su posterior procesamiento, como la sustitución de texto por texto en otro idioma para la internacionalización del contenido.

  • Búsqueda de ubicaciones de texto, de modo que otros gráficos se puedan alinear según corresponda.

Para detectar texto en imágenes en formato JPEG o PNG, utilice la operación DetectText. Para detectar texto en vídeo de forma asíncrona, utilice las operaciones StartTextDetection y GetTextDetection. Las operaciones de detección de texto de imagen y de vídeo admiten la mayoría de las fuentes, incluidas las que tienen un estilo muy sofisticado. Después de detectar texto, Amazon Rekognition crea una representación de palabras y líneas de texto detectadas, muestra la relación entre ellas y le indica dónde está el texto en una imagen o fotograma de vídeo.

Las operaciones DetectText y GetTextDetection detectan palabras y líneas. Una palabra es uno o más caracteres del alfabeto que no están separados por espacios. DetectTextpuede detectar hasta 100 palabras en una imagen. GetTextDetection también puede detectar hasta 100 palabras por fotograma de vídeo.

Una palabra consta de uno o varios caracteres alfabéticos que no están separados por espacios. Amazon Rekognition está diseñado para detectar palabras en inglés, árabe, ruso, alemán, francés, italiano, portugués y español.

Una línea es una cadena de palabras equidistantes. Una línea no es necesariamente una oración completa (los puntos no indican el final de una línea). Por ejemplo, Amazon Rekognition detecta un número de matrícula como una línea. Además, una línea finaliza cuando no hay texto alineado después de ella o cuando existe un hueco grande entre las palabras, en relación con la longitud de las mismas. En función del hueco entre las palabras, Amazon Rekognition podría detectar varias líneas de texto alineado en la misma dirección. Si una frase abarca varias líneas, la operación devuelve varias líneas.

Analice la siguiente imagen.

Los cuadros azules representan información sobre texto detectado y la ubicación del texto que devuelve la operación DetectText. En este ejemplo, Amazon Rekognition detecta "IT'S", "MONDAY", "but", "keep" y "Smiling" como palabras. Amazon Rekognition detecta "IT'S", "MONDAY", "but keep" y "Smiling" como palabras. Para detectarlo, el texto debe estar dentro de una orientación de +/- 90° grados con respecto al eje horizontal.

Para ver un ejemplo, consulte Detección de texto en una imagen.