本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
常見問答集
本節提供有關在 上定義資料湖層的 Amazon Simple Storage Service (Amazon S3) 儲存貯體和路徑名稱的常見問題解答 AWS 雲端。
多區域儲存貯體應該使用什麼名稱?
您可以使用我們建議的 Amazon S3 儲存貯體 AWS 區域 命名格式,並變更識別符。範例包括 examplecompany-raw-useast1-12345-dev
和 examplecoompany-raw-uswest1-12345-dev
。
我是否需要使用原始、階段和分析作為資料湖層的名稱?
否,您可以根據需求命名圖層。不過,我們強烈建議您針對包含原始檔案格式的資料層使用 Amazon S3 儲存貯體,並為此儲存貯體啟用版本控制。
是否可以重新命名 Amazon S3 儲存貯體?
否。如果您想要使用不同的 Amazon S3 儲存貯體名稱,您必須使用新名稱建立新的儲存貯體。這是我們建議您為 Amazon S3 儲存貯體採用明確定義且一致命名方法的原因之一。
如果我刪除儲存貯體並想要重複使用名稱,會發生什麼情況?
如果您刪除 Amazon S3 儲存貯體,並想要使用相同名稱建立新的儲存貯體,則必須等待名稱再次可用。變更可能需要 48-72 小時才會生效。最佳實務是等待至少 48 小時,再建立重複使用先前名稱的新儲存貯體。Amazon S3 儲存貯體名稱是全域唯一的,且全部 AWS 帳戶 共用相同的命名空間。
我可以在儲存貯體名稱或路徑名稱中包含哪些項目是否有限制?
Amazon S3 儲存貯體名稱中僅允許小寫字母、數字、破折號和點。儲存貯體名稱長度必須為 3-63 個字元,開頭和結尾必須是數字或字母,而且不能是 IP 地址格式。名稱也必須是全域唯一的。
對於 Amazon S3 儲存貯體路徑,您可以使用大寫字母,但我們建議您只使用小寫字母。路徑也可以包含其他符號,但我們建議您僅使用底線、破折號、斜線和數字。
我可以在資料湖中使用比登陸區域、原始、階段和分析層更多的層嗎?
可以,您可以根據需要使用任意數量的圖層。不過,我們建議為您的原始資料擁有登陸區域和原始層、格式化資料的中繼層,以及高度模型化資料的層。
如果我尚未定義參數,會發生什麼情況?
某些參數,例如業務單位,不需要併入 Amazon S3 儲存貯體名稱,但可以是路徑的一部分。這表示不需要立即判斷,因為路徑可以在建立 Amazon S3 儲存貯體之後新增。
如何追蹤業務單位層級的成本?
這取決於您的帳戶策略。如果您的業務單位有不同的 AWS 帳戶,您可以將成本分配標籤指派給 Amazon S3 儲存貯體,以反映每個業務單位的儲存貯體成本。
如果您的帳戶策略不會將業務單位分成不同的 AWS 帳戶,則您可以為每個業務單位使用不同的儲存貯體。將業務單位新增至儲存貯體名稱,例如 exampleco-businessunit1-raw-useast1-12345-dev
。不過,這表示您必須管理許多 Amazon S3 儲存貯體。
建立命名標準時應考慮哪些功能?
您必須確保您的 Amazon S3 儲存貯體名稱使用只能在儲存貯體層級使用的功能。例如,成本標籤、儲存貯體加密和版本控制是僅適用於整個 Amazon S3 儲存貯體的功能。這表示它們會套用至儲存貯體中的所有物件和路徑。
物件版本控制也是需要考慮的重要功能。您應該開啟原始層 Amazon S3 儲存貯體的版本控制。如果資料有所變更,這可確保您可以存取先前的版本。不過,資料湖中的所有層可能不需要版本控制,而保留多個版本可能會導致不必要的成本。