分析階段 - AWS 規範指南

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

分析階段

通過處理 PDF 文件,您可以提取可用於進一步處理和分析的內容。例如,您可以使用日常營運報告的成本欄位來識別成本趨勢,或彙總業務營運的關鍵績效指標 (KPI) 來產生見解。您也可以將擷取的內容與其他資料來源 (包括資料湖、資料倉儲、第三方資料或客戶關係管理 (CRM) 資料結合在一起,以執行深入的業務分析。

Amazon QuickSight Simple Storage Service (Amazon S3) 儲存貯體。Amazon Simple Storage Service (Amazon S3) 儲存貯體。然後,您的商業分析師可以建立儀表板,以便從 S3 儲存貯體中的 JSON 檔案進行分析、視覺化並直接產生見解。儀表板會連接到 S3 儲存貯體,並在處理新的 PDF 檔案後自動更新。您也可以與不同的使用者共用儀表板,使用者也可以訂閱儀表板以在行動裝置上檢視儀表板。如需這方面的詳細資訊,請參閱 Amazon QuickSight 文件中的使用 Amazon S3 檔案建立資料集

大多數 PDF 文件還包含表格和表格或自由文本段落中的富文本內容。擷取文字內容後,RTF 內容可供其他可處理自然語言處理 (NLP) 的AWS人工智慧和機器學習 (AI/ML) 服務使用,例如 Amazon ComprehendAmazon Translate。您也可以使用 Amazon Kendra 對從大型 PDF 檔案資料庫擷取的文件進行索引和搜尋。

您的資料科學家和機器學習工程師也可以使用 Amazon SageMaker 直接存取 S3 儲存貯體或 Amazon DynamoDB 表中擷取的資料,然後實作進階機器學習建模和預測。

分析階段

您可以使用以下兩種最佳做法來確保分析階段成功:

  • 建立資訊清單以使用 S3 儲存貯體作為 Amazon Amazon 的資料來源 QuickSight。如需有關這方面的詳細資訊,請參閱 Amazon QuickSight 文件中的使用您自己的 Amazon S3 資料建立分析

  • 自動更新資料集以擷取任何新增到 Amazon S3 的資料,並重新整理儀表板。如需詳細資訊,請參閱 Amazon QuickSight 文件中的按排程重新整理資料集