Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

取り込みフェーズ - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

取り込みフェーズ

組織は、継続的に生成される PDF ファイルタイプ (日次オペレーションレポートなど)、同じ形式、自動的かつ定期的にデータを抽出する必要がある PDF ファイルタイプを識別します。この PDF ファイルを取り込むには、Amazon Simple Storage Service (Amazon S3) バケットが必要です。専用の S3 バケットを作成することをお勧めします。ただし、既存の S3 バケットを使用することもできます。詳細については、Amazon S3 ドキュメントの「バケットの作成」を参照してください。

新しい PDF ファイルが取り込まれると、S3 バケットは AWS Lambda 関数を呼び出します。詳細については、 AWS Lambda ドキュメントのAmazon S3トリガーを使用して Lambda 関数を呼び出す」を参照してください。

次に、Lambda 関数は PDF ファイルを処理します。このプロセスについては、このガイドの処理フェーズ「」セクションで説明します。

取り込みフェーズのベストプラクティス

PDF ファイルの取り込みを成功させるには、次の 4 つのベストプラクティスを使用します。

  • 履歴 PDF ファイルには一括取り込みを使用し、新しい PDF ファイルには継続的な取り込みを使用します。

  • 一括取り込みの場合は、一括ダンプを使用します (ローカルドライブから PDF ファイルをアップロードするなど)。複数の PDF ファイルタイプがある場合は、異なるフォルダを使用して各タイプの PDF ファイルを保持することをお勧めします。また、 などのファイルに一意でわかりやすい命名基準を使用することをお勧めしますwarehouse_<warehouse_number>_<mmddyy>_<PDF_file_type>.pdf

  • 新しい PDF ファイルを継続的に取り込むには、ソースシステムが S3 バケットに接続する必要があります。例えば、ソースシステムから S3 バケットへの日次ダンプを設定できます。

  • PDF ファイルが高品質で、読みやすいことを確認してください。ネイティブ PDF ファイルを使用することをお勧めしますが、個々の単語が明確であれば、スキャンしたドキュメントを PDF 形式に変換することもできます。詳細については、 AWS Machine Learning Blog の「Amazon Textract を使用した PDF ファイルの前処理: ビジュアルの検出と削除」を参照してください。

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.