本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將資料庫叢集資料匯出至 Amazon S3
您可以將資料從即時 Amazon Aurora 資料庫叢集匯出至 Amazon S3 儲存貯體。匯出程序會在背景中執行,不會影響您作用中資料庫叢集的效能。
根據預設,會匯出資料庫叢集中的所有資料。但是,您可以選擇匯出特定資料庫、結構描述或資料表集。
Amazon Aurora 會複製資料庫叢集、從複製品中擷取資料,並將資料存放在 Amazon S3 儲存貯體中。資料會以壓縮且一致的 Apache Parquet 格式存放。個別 Parquet 檔案的大小通常約為 1–10 MB。
您可以透過匯出 Aurora MySQL 第 2 版和第 3 版的快照資料而取得的更快效能,不適用於匯出資料庫叢集資料。如需更多詳細資訊,請參閱 將資料庫叢集快照資料匯出至 Amazon S3。
無論您匯出全部或部分資料,都需支付匯出整個資料庫叢集的費用。如需詳細資訊,請參閱 Amazon Aurora 定價頁面
匯出資料後,您可以直接透過 Amazon Athena 或 Amazon Redshift Spectrum 等工具分析匯出後的資料。有關使用 Athena 來讀取 Parquet 資料的詳細資訊,請參閱Amazon Athena 使用者指南中的 Parquet SerDe。如需有關使用 Redshift Spectrum 來讀取 Parquet 資料的詳細資訊,請參閱《Amazon Redshift 資料庫開發人員指南》中的從單欄式資料格式的 COPY。
功能可用性和支援會因每個資料庫引擎的特定版本以及 AWS 區域 而有所不同。如需將資料庫叢集資料匯出至 S3 功能之版本和區域可用性的詳細資訊,請參閱 將叢集資料匯出至 Amazon S3 的支援區域和 Aurora 資料庫引擎。
您可以使用下列程序,將資料庫叢集資料匯出至 Amazon S3 儲存貯體。如需詳細資訊,請參閱下列各節。
匯出資料庫叢集資料的概觀
-
識別您要匯出其資料的資料庫叢集。
-
設定對 Amazon S3 儲存貯體的存取。
「儲存貯體」是 Amazon S3 物件或檔案的容器。如要提供存取儲存貯體的資訊,請採取下列步驟:
-
識別要匯出資料庫叢集資料的目標 S3 儲存貯體。S3 儲存貯體必須與資料庫叢集位於相同的 AWS 區域。如需更多詳細資訊,請參閱 識別要匯出的 Amazon S3 儲存貯體。
-
建立 AWS Identity and Access Management (IAM) 角色,授予資料庫叢集匯出任務對 S3 儲存貯體的存取權。如需更多詳細資訊,請參閱 使用 IAM 角色提供對 Amazon S3 儲存貯體的存取權。
-
-
建立用於伺服器端加密的對稱式加密 AWS KMS key。叢集匯出任務會在將匯出資料寫入至 S3 時,使用 KMS 金鑰來設定 AWS KMS 伺服器端加密。
KMS 金鑰政策必須同時包含
kms:CreateGrant和kms:DescribeKey許可。如需在 Amazon Aurora 中使用 KMS 金鑰的詳細資訊,請參閱 AWS KMS key管理。如果您的 KMS 金鑰政策中有拒絕陳述式,請務必明確排除 AWS 服務主體
export.rds.amazonaws.com。您可以使用 AWS 帳戶內的 KMS 金鑰,或使用跨帳戶 KMS 金鑰。如需更多詳細資訊,請參閱 使用跨帳戶 AWS KMS key。
-
使用主控台或
start-export-taskCLI 命令,將資料庫叢集匯出至 Amazon S3。如需更多詳細資訊,請參閱 建立資料庫叢集匯出任務。 -
若要存取 Amazon S3 儲存貯體中您匯出的資料,請參閱《Amazon Simple Storage Service 使用者指南》中的上傳、下載及管理物件。
在以下各節中了解如何設定、匯出、監控、取消資料庫叢集匯出任務,以及進行疑難排解。