Procesamiento de documentos

Amazon Comprehend admite el procesamiento de documentos en un solo paso para la clasificación personalizada y para el reconocimiento de entidades personalizadas. Por ejemplo, puede introducir una combinación de documentos de texto sin formato y documentos semiestructurados (como documentos PDF, documentos de Microsoft Word e imágenes) en un trabajo de análisis personalizado.

En el caso de los archivos de entrada que requieren extracción de texto, Amazon Comprehend realiza automáticamente la extracción de texto antes de ejecutar el análisis. Para extraer el contenido del texto, Amazon Comprehend utiliza un analizador interno para documentos semiestructurados nativos y utiliza Amazon Textract para imágenes y documentos APIs escaneados.

El procesamiento de documentos de Amazon Comprehend está disponible en todos los Amazon Regiones compatibles Comprehend, excepto en Asia-Pacífico (Tokio) AWS GovCloud y (EE. UU. Oeste), que solo admiten modelos de texto sin formato para una clasificación personalizada.

En los temas siguientes se proporcionan detalles sobre los tipos de documentos de entrada que Amazon Comprehend admite para el análisis personalizado.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Redacción de entidades de PII

Entradas para análisis en tiempo real