Procesamiento de documentos - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Procesamiento de documentos

Amazon Comprehend admite el procesamiento de documentos en un solo paso para la clasificación personalizada y para el reconocimiento de entidades personalizadas. Por ejemplo, puede introducir una combinación de documentos de texto sin formato y documentos semiestructurados (como documentos PDF, documentos de Microsoft Word e imágenes) en un trabajo de análisis personalizado.

En el caso de los archivos de entrada que requieren extracción de texto, Amazon Comprehend realiza automáticamente la extracción de texto antes de ejecutar el análisis. Para extraer el contenido del texto, Amazon Comprehend utiliza un analizador interno para documentos semiestructurados nativos y utiliza las API de Amazon Textract para imágenes y documentos escaneados.

El procesamiento de documentos de Amazon Comprehend está disponible en todos los Amazon Regiones admitidas Comprehend, excepto en Asia-Pacífico (Tokio) AWS GovCloud y (EE. UU. Oeste), que solo admiten modelos de texto sin formato para una clasificación personalizada.

En los temas siguientes se proporcionan detalles sobre los tipos de documentos de entrada que Amazon Comprehend admite para el análisis personalizado.