分析階段 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

分析階段

透過處理 PDF 檔案,您可以擷取可用於進一步處理和分析的內容。例如,您可以使用每日營運報告的成本欄位來識別成本趨勢,或透過彙總業務營運的關鍵效能指標 (KPIs) 來產生洞見。您也可以將擷取的內容與其他資料來源合併,包括資料湖、資料倉儲、第三方資料或客戶關係管理 (CRM) 資料,以執行深入的業務分析。

Amazon QuickSight 是一種無伺服器商業智慧服務,可連線至 Amazon Simple Storage Service (Amazon S3) 儲存貯體,其中包含您擷取的 PDF 檔案資料。然後,您的業務分析師可以建立儀表板,以分析、視覺化和直接從 S3 儲存貯體中的 JSON 檔案產生洞見。儀表板會連線至 S3 儲存貯體,並在處理新的 PDF 檔案後自動更新。您也可以與不同的使用者共用儀表板,使用者也可以訂閱儀表板,在行動裝置上檢視儀表板。如需詳細資訊,請參閱《Amazon QuickSight 文件》中的使用 Amazon S3 檔案建立資料集。 Amazon QuickSight

大多數 PDF 檔案也在表單和資料表或任意文字段落中包含豐富的文字內容。擷取文字內容後,其他 AWS 人工智慧和機器學習 (AI/ML) 服務可以使用豐富的文字內容,這些服務可以處理自然語言處理 (NLP),例如 Amazon ComprehendAmazon Translate。您也可以使用 Amazon Kendra 來索引和搜尋從大型 PDF 檔案資料庫擷取的文件。

您的資料科學家和機器學習工程師也可以使用 Amazon SageMaker AI 直接存取 S3 儲存貯體或 Amazon DynamoDB 資料表中擷取的資料,然後實作進階 ML 建模和預測。

分析階段的最佳實務

您可以使用下列兩個最佳實務來確保成功的分析階段:

  • 建立資訊清單檔案,以使用 S3 儲存貯體做為 QuickSight 的資料來源。如需詳細資訊,請參閱 QuickSight 文件中的使用您自己的 Amazon S3 資料建立分析

  • 自動更新您的資料集,以擷取新增至 Amazon S3 的任何新資料,並重新整理儀表板。如需詳細資訊,請參閱 QuickSight 文件中的依排程重新整理資料集