Traitement de documents avec des opérations asynchrones - Amazon Textract

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Traitement de documents avec des opérations asynchrones

Amazon Textract peut détecter et analyser du texte dans des documents multipages au format PDF ou TIFF. Cela inclut les factures et les reçus. Le traitement de documents multipages est une opération asynchrone. Le traitement asynchrone de documents est utile pour le traitement de documents volumineux sur plusieurs pages. Par exemple, un fichier PDF de plus de 1 000 pages prend un certain temps à traiter. Le traitement asynchrone du fichier PDF permet à votre application d'effectuer d'autres tâches pendant qu'elle attend la fin du processus.

Cette section explique comment utiliser Amazon Textract pour détecter et analyser de manière asynchrone du texte sur un document multipage ou une seule page. Les documents multipages doivent être au format PDF ou TIFF. Les documents d'une page traités avec des opérations asynchrones peuvent être au format JPEG, PNG, TIFF ou PDF.

Vous pouvez utiliser les opérations asynchrone Amazon Textract aux fins suivantes :

  • Détection de texte : vous pouvez détecter des lignes et des mots sur un document multipage. Les opérations asynchrones sont les suivantes :StartDocumentTextDetectionetGetDocumentTextDetection. Pour plus d'informations, consultez Détection de texte.

  • Analyse de texte : vous pouvez identifier les relations entre le texte détecté sur un document multipage. Les opérations asynchrones sont les suivantes :StartDocumentAnalysisetGetDocumentAnalysis. Pour plus d'informations, consultez Analyse des documents.

  • Analyse des dépenses : vous pouvez identifier les relations de données sur des factures et des reçus multipages. Amazon Textract traite chaque facture ou page de réception d'un document de plusieurs pages comme un reçu individuel ou une facture. Il ne conserve pas le contexte d'une page à une autre d'un document multi-pages. Les opérations asynchrones sont les suivantes :StartExpenseAnalysisetGetExpenseAnalysis. Pour plus d'informations, consultez Analyse des factures et des reçus.