本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
数据湖设计准则
构建数据湖可以打破数据孤岛并实现数据普及性,便于价值提取。中央数据存储库使组织能够作出数据驱动型决策并快速创新。
组织需要经济高效且富有弹性的存储容量来存储呈指数级增长的不同数据来源。他们希望集中管理和共享跨不同业务部门的海量数据。此外,他们希望让员工和利益相关者能够用更短的时间获得业务见解 time-to-value。
设计数据湖时的注意事项:
-
如何收集、存储和分析各种数据类型(包括结构化、非结构化和半结构化)的高速数据?
-
如何以经济高效的方式在全球范围内按需存储和共享数 PB 数据?
-
如何扩展 IT 资源以支持针对数据的大量并发查询,并自动缩减规模以节省成本?
-
如今,您的用户如何查看和搜索多个数据存储库并对其运行查询?
-
如何利用历史数据模式和过往场景获得未来洞察?