AnalyzeExpense - Amazon Textract

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AnalyzeExpense

AnalyzeExpenseテキスト間の財政的関連関係について、入力ドキュメントを同期的に分析します。

情報は次のように返されます。ExpenseDocumentsとし、以下のように分離した。

  • LineItemGroups-を含むデータセットLineItems購入したアイテムや領収書の価格など、テキスト行に関する情報を格納する場所。

  • SummaryFields-ヘッダー情報や仕入先名など、領収書のその他のすべての情報が含まれます。

リクエストの構文

{ "Document": { "Bytes": blob, "S3Object": { "Bucket": "string", "Name": "string", "Version": "string" } } }

リクエストパラメータ

リクエストは以下の JSON 形式のデータを受け入れます。

Document

バイトまたは S3 オブジェクトとしての入力ドキュメント。

イメージのバイトを Amazon Textract API オペレーションに渡すには、Bytesプロパティ。たとえば、Bytesローカルファイルシステムからロードされたドキュメントを渡すプロパティです。を使用して渡されるイメージバイト数Bytesプロパティは base64 でエンコードされている必要があります。AWS SDK を使用してAmazon Textract API オペレーションを呼び出す場合、コードでは、ドキュメントファイルのバイトをエンコードする必要がない場合があります。

S3 バケットに保存されたイメージを Amazon Textract API オペレーションに渡すには、S3Objectプロパティ。S3 バケットに保存されたドキュメントは base64 でエンコードする必要はありません。

S3 オブジェクトが含まれている S3 バケットの AWS リージョンと Amazon Textract オペレーションで使用する AWS リージョンが一致している必要があります。

AWS CLI を使用して Amazon Textract オペレーションを呼び出す場合、Bytes プロパティを使用したイメージのバイトを渡すことはサポートされていません。最初に Amazon S3 バケットにドキュメントをアップロードし、次に S3Object プロパティを使用してオペレーションを呼び出します。

Amazon Textract が S3 オブジェクトを処理するには、ユーザーが S3 オブジェクトにアクセスするためのアクセス許可が必要です。

型: Document オブジェクト

必須 はい

レスポンスの構文

{ "DocumentMetadata": { "Pages": number }, "ExpenseDocuments": [ { "ExpenseIndex": number, "LineItemGroups": [ { "LineItemGroupIndex": number, "LineItems": [ { "LineItemExpenseFields": [ { "LabelDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" }, "PageNumber": number, "Type": { "Confidence": number, "Text": "string" }, "ValueDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" } } ] } ] } ], "SummaryFields": [ { "LabelDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" }, "PageNumber": number, "Type": { "Confidence": number, "Text": "string" }, "ValueDetection": { "Confidence": number, "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Text": "string" } } ] } ] }

レスポンス要素

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

サービスから以下のデータが JSON 形式で返されます。

DocumentMetadata

入力ドキュメントに関する情報。

型: DocumentMetadata オブジェクト

ExpenseDocuments

Amazon Textract によって検出された経費。

Type: 配列のExpenseDocumentオブジェクト

エラー

AccessDeniedException

そのアクションを実行する権限がありません。そのオペレーションを実行するには、承認されたユーザーまたは IAM ロールの Amazon リソースネーム (ARN) を使用します。

HTTP ステータスコード: 400

BadDocumentException

Amazon Textract はドキュメントを読み取ることができません。Amazon Textract のドキュメント制限の詳細については、「」を参照してください。Amazon Textract のハード制限

HTTP ステータスコード: 400

DocumentTooLargeException

文書が大きすぎるため処理できません。10 MB の同期オペレーションの最大ドキュメントサイズ。非同期操作の最大ドキュメントサイズは、PDF ファイルの場合 500 MB です。

HTTP ステータスコード: 400

InternalServerError

Amazon Textract でサービスの問題が発生しました。もう一度やり直してください。

HTTP ステータスコード: 500

InvalidParameterException

入力パラメータが制約に違反しています。たとえば、同期操作では、InvalidParameterException例外が発生するのは、どちらもS3ObjectまたはBytes値は、Documentリクエストパラメータ。API オペレーションを再度呼び出す前にパラメータを検証します。

HTTP ステータスコード: 400

InvalidS3ObjectException

Amazon Textract は、リクエストで指定された S3 オブジェクトにアクセスできません。詳細については、Amazon S3 へのアクセスの設定トラブルシューティング情報については、「」を参照してください。Amazon S3 トラブルシューティング

HTTP ステータスコード: 400

ProvisionedThroughputExceededException

お客様のスループット制限を超えたリクエストの数。この上限を引き上げる場合は、Amazon Textract までお問い合わせください。

HTTP ステータスコード: 400

ThrottlingException

Amazon Textract は一時的にリクエストを処理できませんでした。もう一度やり直してください。

HTTP ステータスコード: 500

UnsupportedDocumentException

入力ドキュメントの形式はサポートされていません。操作用のドキュメントは、PNG、JPEG、PDF、または TIFF 形式にすることができます。

HTTP ステータスコード: 400

以下の資料も参照してください。

言語固有の AWS SDK のいずれかでこの API を使用する方法の詳細については、次を参照してください: