本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
資料湖設計原則
建置資料湖可以分解資料孤島,並將資料民主化以擷取值。中央資料儲存庫可讓組織做出資料驅動的決策並快速創新。
組織希望具有成本效益和彈性的儲存容量,來存放呈指數增長的不同資料來源。他們想要集中管理和跨不同業務單位共享大量資料。此外,他們想要授權員工和利益相關者以較短time-to-value獲得商業洞見。
設計資料湖時的考量事項:
-
如何收集、存放和分析各種資料類型的高速資料,包括結構化、非結構化和半結構化?
-
如何以具成本效益的方式,在全球範圍內隨需存放和共用 PB 的資料?
-
如何擴展 IT 資源以支援針對資料進行大量並行查詢,並自動縮減以節省成本?
-
您的使用者今天如何檢視、搜尋和對多個資料儲存庫執行查詢?
-
如何使用歷史資料模式和過去案例來衍生未來的洞見?