資料湖設計原則 - Amazon Connect Data Lake 最佳實務

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料湖設計原則

建置資料湖可以分解資料孤島,並將資料民主化以擷取值。中央資料儲存庫可讓組織做出資料驅動的決策並快速創新。

組織希望具有成本效益和彈性的儲存容量,來存放呈指數增長的不同資料來源。他們想要集中管理和跨不同業務單位共享大量資料。此外,他們想要授權員工和利益相關者以較短time-to-value獲得商業洞見。

設計資料湖時的考量事項:

  • 如何收集、存放和分析各種資料類型的高速資料,包括結構化、非結構化和半結構化?

  • 如何以具成本效益的方式,在全球範圍內隨需存放和共用 PB 的資料?

  • 如何擴展 IT 資源以支援針對資料進行大量並行查詢,並自動縮減以節省成本?

  • 您的使用者今天如何檢視、搜尋和對多個資料儲存庫執行查詢?

  • 如何使用歷史資料模式和過去案例來衍生未來的洞見?