AnalyzeExpense - Amazon Textract

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AnalyzeExpense

AnalyzeExpense同步分析輸入文檔之間的財務相關關係。

信息返回為ExpenseDocuments並分開如下。

  • LineItemGroups-包含LineItems存儲有關文本行的信息,例如購買的物料及其收據上的價格。

  • SummaryFields-包含收據的所有其他信息,例如題頭信息或供應商名稱。

請求語法

{ "Document": { "Bytes": blob, "S3Object": { "Bucket": "string", "Name": "string", "Version": "string" } } }

請求參數

請求接受採用 JSON 格式的下列資料。

Document

輸入文檔,作為字節或 S3 對象。

您可以使用Bytes屬性。例如,您需要使用Bytes屬性傳遞從本地文件系統加載的文檔。通過使用Bytes屬性必須經過 base64 編碼。如果您使用 AWS 開發工具包調用 Amazon Textract API 操作,則您的代碼可能無需對文檔文件字節進行編碼。

您可以使用 S3 儲存貯體中的影像來傳遞至 Amazon Textract API 操作,方法是使用S3Object屬性。存放在 S3 儲存貯體中的檔案,不需要 base64 編碼。

含有 S3 物件的 S3 儲存貯體區域必須符合您用於 Amazon Textract 操作的 AWS 區域。

如果您使用 AWS CLI 呼叫 Amazon Textract 操作,則不支援使用 Bytes 屬性來傳遞影像位元組。您必須先將文件上傳至 Amazon S3 儲存貯體,再使用 S3Object 屬性呼叫操作。

若要 Amazon Textract 處理 S3 物件,用户必須具有 S3 物件的存取許可。

類型:Document 物件

:必要 是

回應語法

{ "DocumentMetadata": { "Pages": number }, "ExpenseDocuments": [ { "ExpenseIndex": number, "LineItemGroups": [ { "LineItemGroupIndex": number, "LineItems": [ { "LineItemExpenseFields": [ { "LabelDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" }, "PageNumber": number, "Type": { "Confidence": number, "Text": "string" }, "ValueDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" } } ] } ] } ], "SummaryFields": [ { "LabelDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" }, "PageNumber": number, "Type": { "Confidence": number, "Text": "string" }, "ValueDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" } } ] } ] }

回應元素

如果動作成功,則服務傳回 HTTP 200 回應。

服務會傳回下列 JSON 格式的資料。

DocumentMetadata

有關輸入文檔的信息。

類型:DocumentMetadata 物件

ExpenseDocuments

Amazon Textract 檢測到的費用。

類型:的陣列ExpenseDocument對象

錯誤

AccessDeniedException

您未獲授權執行動作。使用已獲授權之使用者或 IAM 角色的 Amazon Resource Name (ARN) 來執行操作。

HTTP 狀態碼:HTTP 狀態碼:400

BadDocumentException

Amazon Textract 無法閲讀該文檔。有關 Amazon Textract 中文檔限制的更多信息,請參閲亞馬遜文字中的硬性限制

HTTP 狀態碼:HTTP 狀態碼:400

DocumentTooLargeException

無法處理該文檔,因為它太大。同步操作的最大檔案大小為 10 MB。對於 PDF 文件,異步操作的最大文檔大小為 500 MB。

HTTP 狀態碼:HTTP 狀態碼:400

InternalServerError

Amazon Textract 發生服務問題。請再次嘗試呼叫。

HTTP 狀態碼:HTTP 狀態碼:500

InvalidParameterException

輸入參數違反限制。例如,在同步操作中,InvalidParameterException異常發生時,S3Object或者Bytes值提供在Document請求參數。請驗證您的參數,然後再次呼叫 API 操作。

HTTP 狀態碼:HTTP 狀態碼:400

InvalidS3ObjectException

Amazon Textract 無法存取請求中指定的 S3 物件。有關詳細信息,請設定對 Amazon S3 的存取如需故障診斷資訊,請參閱 。故障診斷 Amazon S3

HTTP 狀態碼:HTTP 狀態碼:400

ProvisionedThroughputExceededException

請求數超過您的傳輸量限制。如果您希望提高此限制,請聯絡 Amazon Textract。

HTTP 狀態碼:HTTP 狀態碼:400

ThrottlingException

Amazon Textract 暫時無法處理請求。請再次嘗試呼叫。

HTTP 狀態碼:HTTP 狀態碼:500

UnsupportedDocumentException

不支援輸入檔案的格式。操作文檔可以採用 PNG、JPEG、PDF 或 TIFF 格式。

HTTP 狀態碼:HTTP 狀態碼:400

另請參閱

如需在語言特定的 AWS 開發套件之一中使用此 API 的詳細資訊,請參閱下列說明: