本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
常见问题解答
本节提供了有关定义 Amazon Simple Storage Service (Amazon S3) 存储桶和上数据湖层路径名的常见问题的答案。 AWS Cloud
我应该为多区域存储桶使用什么名称?
您可以使用我们推荐的 Amazon S3 存储桶命名格式并更改标 AWS 区域
识符。示例包括 examplecompany-raw-useast1-12345-dev
和 examplecoompany-raw-uswest1-12345-dev
。
我是否需要使用原始、暂存和分析作为我的数据湖层的名称?
不,您可以根据自己的要求命名图层。但是,我们强烈建议您使用包含原始文件格式的数据层的 Amazon S3 存储桶,并为该存储桶启用版本控制。
是否可以重命名 Amazon S3 存储桶?
不是。 如果您想使用不同的 Amazon S3 存储桶名称,则必须使用新名称创建一个新的存储桶。这就是我们建议对 Amazon S3 存储桶采用明确定义且一致的命名方法的原因之一。
如果我删除存储桶并想重复使用该名称会怎样?
如果您删除了 Amazon S3 存储桶并想要创建同名的新存储桶,则必须等待该名称再次可用。更改可能需要 48-72 小时才能生效。最佳做法是至少等待 48 小时才能创建重复使用先前名称的新存储桶。Amazon S3 存储桶名称在全球范围内是唯一的,并且都 AWS 账户 共享同一个命名空间。
我可以在存储桶名称或路径名中包含的内容有限制吗?
Amazon S3 存储桶名称中只允许使用小写字母、数字、破折号和点。存储桶名称的长度必须为 3—63 个字符,必须以数字或字母开头和结尾,并且不能采用 IP 地址格式。这些名称还必须是全球唯一的。
对于 Amazon S3 存储桶路径,您可以使用大写字母,但我们建议您仅使用小写字母。路径也可以包含其他符号,但我们建议您仅使用下划线、破折号、斜杠和数字。
我能否使用比数据湖中的着陆区、原始层、舞台层和分析层更多的图层?
是的,你可以根据需要使用任意数量的图层。但是,我们建议为原始数据设置一个 landing zone 和原始层,为格式化数据设置中间层,为高度建模的数据设置一个图层。
如果我没有定义参数会怎样?
某些参数(例如业务单位)不需要合并到 Amazon S3 存储桶名称中,但可以作为路径的一部分。这意味着无需立即确定路径,因为可以在创建 Amazon S3 存储桶后添加路径。
如何跟踪业务部门层面的成本?
这取决于您的账户策略。如果您的业务部门是独立的 AWS 账户,则可以为 Amazon S3 存储桶分配成本分配标签,以反映每个业务部门的存储桶成本。
如果您的账户策略没有将业务部门划分为不同的部门 AWS 账户,那么您可以为每个业务部门使用不同的分区。将业务部门添加到存储桶名称中,例如exampleco-businessunit1-raw-useast1-12345-dev
。但是,这意味着您必须管理许多 Amazon S3 存储桶。
在创建命名标准时我应该考虑哪些功能?
您必须确保您的 Amazon S3 存储桶名称使用仅在存储桶级别可用的功能。例如,成本标签、存储桶加密和版本控制等功能仅适用于整个 Amazon S3 存储桶。这意味着它们适用于存储桶中的所有对象和路径。
对象版本控制也是一个需要考虑的重要功能。您应该为原始层的 Amazon S3 存储桶启用版本控制。这样可以确保在数据发生更改时可以访问以前的版本。但是,可能不必对数据湖中的所有图层进行版本控制,并且保留多个版本可能会导致不必要的成本。