SUS04-BP06 使用共享文件系统或存储来访问通用数据
采用共享文件系统或存储来避免数据重复,并可为工作负载提供更高效的基础设施。
常见反模式:
-
为每个客户端预置存储。
-
未卸下不活动的客户端的数据卷。
-
不提供跨平台和系统的存储访问。
建立此最佳实践的好处:使用共享文件系统或存储可以将数据共享给一个或多个使用者,而无需复制数据。这有助于减少工作负载所需的存储资源。
在未建立这种最佳实践的情况下暴露的风险等级:中
实施指导
如果您有多个用户或应用程序访问同一个数据集,则使用共享存储技术很重要,这可以让工作负载高效地使用基础设施。共享存储技术提供一个位置来集中存储和管理数据集并避免数据重复。它还加强了不同系统之间数据的一致性。此外,因为多个计算资源会同时并行访问和处理数据,所以利用共享存储技术可以更高效地使用计算能力。
仅在需要时才从这些共享存储服务中提取数据,并卸下未使用的卷以释放资源。
实施步骤
-
使用共享存储:当数据具有多个使用者时,将数据迁移到共享存储。下面是 AWS 上的共享存储技术的一些示例:
存储选项 何时使用 Amazon EBS 多重挂载让您可以将单个预调配 IOPS SSD(io1 或 io2)卷挂载到同一可用区中的多个实例。
请参阅《何时选择 Amazon EFS
》。 请参阅《选择 Amazon FSx 文件系统
》。 不需要文件系统结构而旨在与对象存储一起使用的应用程序可以使用 Amazon S3 作为可大规模扩展、持久、低成本的对象存储解决方案。
-
根据需要提取数据:仅在需要时,才将数据复制到共享文件系统或从共享文件系统提取数据。例如,您可以创建由 Amazon S3 支持的适用于 Lustre 的 Amazon FSx 文件系统
,并且只将处理任务所需的数据子集加载到 Amazon FSx。 -
删除不需要的数据:根据您的使用规律适当删除数据,如 SUS04-BP03 使用策略管理数据集的生命周期中所述。
-
分离不活动的客户端:将卷与未积极使用它们的客户端分离。
资源
相关文档:
相关视频: