入力ドキュメント - Amazon Textract

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

入力ドキュメント

Amazon Textract オペレーションに適した入力は、単一ページまたは複数ページのドキュメントです。いくつかの例は、法的文書、フォーム、ID、または手紙です。フォームは、ユーザーが回答を提供するための質問またはプロンプトを含むドキュメントです。例としては、患者登録フォーム、納税フォーム、または保険請求フォームなどがあります。

ドキュメントは、JPEG、PNG、PDF、または TIFF 形式にすることができます。PDF および TIFF 形式のファイルを使用すると、複数ページのドキュメントを処理できます。Amazon Textract がドキュメントを次のように表現する方法の詳細についてはBlockオブジェクト、「」を参照してください。テキスト検出および文書分析応答オブジェクト

以下に、入力ドキュメントの例を示します。

ヘッダー雇用申請書付きの白い紙の画像。次の行には、アプリケーション情報、次のフルネームが表示されます。ジェーン・ドー、次の電話番号:555-0100、次のホームアドレス:123 米国AnyTown AnyStreet、次の郵送先住所:上記と同じ。下には、以前の雇用履歴というタイトルの表があります。これは 5 つの列と 4 行あります。列のタイトルは、「開始日」、「終了日」、「雇用者名」、「保留中の職階」、「退去理由」です。次の行には、2009 年 1 月 15 日、2011 年 6 月 30 日、任意の会社、ベーカーアシスタント、および移転を示します。次の2011年7月1日、2013年8月10日、Example Corp. Baker、より良いopp。次の2013年8月15日、現在、AnyCompany、Head baker、N/A、現在。

ドキュメントの制限の詳細については、「」を参照してください。Amazon Textract のハード制限

Amazon Textract 同期オペレーションでは、Amazon S3 バケットに格納されている入力ドキュメントを使用するか、base64 でエンコードされたイメージバイトを渡すことができます。詳細については、「Amazon Textract 同期オペレーションを呼び出す」を参照してください。非同期オペレーションの場合は、Amazon S3 バケットで入力ドキュメントを指定する必要があります。詳細については、「Amazon Textract 非同期オペレーションを呼び出す」を参照してください。