Analysieren von Rechnungen und Belegen - Amazon Textract

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Analysieren von Rechnungen und Belegen

Amazon Textract extrahiert relevante Daten wie Kontaktinformationen, gekaufte Artikel und den Namen des Lieferanten aus fast jeder Rechnung oder Quittung, ohne dass Vorlagen oder Konfigurationen erforderlich sind. Rechnungen und Belege verwenden häufig verschiedene Layouts, was es schwierig und zeitaufwändig macht, Daten in großem Maßstab manuell zu extrahieren. Amazon Textract verwendet ML, um den Kontext von Rechnungen und Belegen zu verstehen, und extrahiert automatisch Daten wie Rechnungs- oder Empfangsdatum, Rechnungs- oder Belegnummer, Artikelpreise, Gesamtbetrag und Zahlungsbedingungen, um Ihren Geschäftsanforderungen gerecht zu werden.

Amazon Textract identifiziert auch Anbieternamen, die für Ihre Workflows entscheidend sind, aber möglicherweise nicht explizit gekennzeichnet sind. Amazon Textract kann beispielsweise den Händlernamen auf einer Quittung finden, auch wenn er nur in einem Logo oben auf der Seite ohne explizite Schlüssel-Wert-Paarkombination angegeben ist. Amazon Textract macht es Ihnen auch leicht, Eingaben aus verschiedenen Belegen und Rechnungen zu konsolidieren, die unterschiedliche Wörter für dasselbe Konzept verwenden. Amazon Textract ordnet beispielsweise Beziehungen zwischen Feldnamen in verschiedenen Dokumenten wie Kundennummer, Kundennummer und Konto-ID ab und gibt Standardtaxonomie alsINVOICE_RECEIPT_IDaus. In diesem Fall repräsentiert Amazon Textract Daten konsistent über verschiedene Dokumenttypen hinweg. Felder, die nicht mit der Standardtaxonomie übereinstimmen, werden kategorisiert alsOTHERaus.

Nachfolgend ist eine Liste der Standardfelder, die AnalyzeExpense derzeit unterstützt:

  • Anbieter-Name:VENDOR_NAME

  • Gesamt:TOTAL

  • Adresse des Empfängers:RECEIVER_ADDRESS

  • Rechnung/Zahlungsdatum:INVOICE_RECEIPT_DATE

  • Rechnung/Belegnummer:INVOICE_RECEIPT_ID

  • Zahlungsbedingungen:PAYMENT_TERMS

  • Zwischensumme:SUBTOTAL

  • Fälligkeitsdatum:DUE_DATE

  • Steuer:TAX

  • Rechnungssteuerzahler-ID (SSN/ITIN oder EIN):TAX_PAYER_ID

  • Elementname:ITEM_NAME

  • Preis des Artikels:PRICE

  • Artikelmenge:QUANTITY

Die AnalyzeExpense-API gibt die folgenden Elemente für eine bestimmte Dokumentseite zurück:

  • Die Anzahl der Belege oder Rechnungen innerhalb einer Seite, die alsExpenseIndex

  • Der standardisierte Name für einzelne Felder dargestellt alsType

  • Der tatsächliche Name des Feldes, wie es im Dokument angezeigt wird, dargestellt alsLabelDetection

  • Der Wert des entsprechenden Feldes, dargestellt alsValueDetection

  • Die Anzahl der Seiten innerhalb des eingereichten Dokuments, dargestellt alsPages

  • Die Seitenzahl, unter der das Feld, der Wert oder die Einzelposten erkannt wurden, dargestellt alsPageNumber

  • Die Geometrie, die den Begrenzungsrahmen und die Koordinatenposition des einzelnen Feldes, Werts oder der Einzelposten auf der Seite enthält, dargestellt alsGeometry

  • Der Konfidenzwert, der mit jedem im Dokument erkannten Daten verknüpft ist, dargestellt alsConfidence

  • Die gesamte Reihe der gekauften Einzelposten, dargestellt alsEXPENSE_ROW

Das Folgende ist ein Teil der API-Ausgabe für einen von AnalyzeExpense verarbeiteten Beleg, der die Summe anzeigt: 55,64$ in dem als Standardfeld extrahierten DokumentTOTAL, tatsächlicher Text auf dem Dokument als „Gesamt“, Konfidenzwert von „97.1“, Seitenzahl „1“, Der Gesamtwert als „55,64$“ und der Begrenzungsrahmen- und Polygonkoordinaten:

{ "Type": { "Text": "TOTAL", "Confidence": 99.94717407226562 }, "LabelDetection": { "Text": "Total:", "Geometry": { "BoundingBox": { "Width": 0.09809663146734238, "Height": 0.0234375, "Left": 0.36822840571403503, "Top": 0.8017578125 }, "Polygon": [ { "X": 0.36822840571403503, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8251953125 }, { "X": 0.36822840571403503, "Y": 0.8251953125 } ] }, "Confidence": 97.10792541503906 }, "ValueDetection": { "Text": "$55.64", "Geometry": { "BoundingBox": { "Width": 0.10395314544439316, "Height": 0.0244140625, "Left": 0.66837477684021, "Top": 0.802734375 }, "Polygon": [ { "X": 0.66837477684021, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.8271484375 }, { "X": 0.66837477684021, "Y": 0.8271484375 } ] }, "Confidence": 99.85165405273438 }, "PageNumber": 1 }

Sie können synchrone Vorgänge verwenden, um eine Rechnung oder einen Beleg zu analysieren. Um diese Dokumente zu analysieren, verwenden Sie den AnalyzeExpense-Vorgang und übergeben eine Quittung oder Rechnung an sie.AnalyzeExpensegibt den gesamten Ergebnissatz zurück. Weitere Informationen finden Sie unter Rechnungen und Belege mit Amazon Textract analysieren .

Um Rechnungen und Belege asynchron zu analysieren, verwenden SieStartExpenseAnalysisum mit der Verarbeitung einer Eingabedokumentdatei zu beginnen. Rufen Sie an, um die Ergebnisse zu erhaltenGetExpenseAnalysisaus. Die Ergebnisse für einen bestimmten Aufruf anStartExpenseAnalysiswerden von zurückgegebenGetExpenseAnalysisaus. Weitere Informationen sowie ein Beispiel finden Sie unter Dokumente mit asynchronen Operationen verarbeiten.