本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 AWS 資料管道
Notice (注意)
AWS Data Pipeline 不再提供給新客戶。的現有客戶 AWS Data Pipeline 可以繼續正常使用服務。進一步了解
AWS Data Pipeline 是一種 Web 服務,可用來自動化資料移動和轉換。您可以使用資料管道建立管道,從來源帳戶匯出資料表資料。匯出的資料會存放在目標帳戶中的 Amazon Simple Storage Service (Amazon S3) 儲存貯體中。目標帳戶中的 S3 儲存貯體必須可從來源帳戶存取。若要允許此跨帳戶存取,請更新目標 S3 儲存貯體中的存取控制清單 (ACL)。
在目標帳戶中建立另一個管道 (Account-B),將資料從 S3 儲存貯體匯入目標帳戶中的資料表。
這是將 Amazon DynamoDB 資料表備份至 Amazon S3 的傳統方法,並從 Amazon S3 還原,直到 AWS Glue 引入原生讀取 DynamoDB 資料表的支援。
優點
-
這是無伺服器解決方案。
-
不需要新的程式碼。
-
AWS Data Pipeline 會在任務的場景後方使用 Amazon EMR 叢集,因此此方法非常有效率,可以處理大型資料集。
缺點
-
需要 AWS 其他服務 (資料管道和 Amazon S3)。
-
程序會在來源資料表和涉及的目標資料表上耗用佈建的輸送量,因此可能會影響效能和可用性。
-
此方法會產生額外的成本,超過 DynamoDB 讀取容量單位 (RCUs) 和寫入容量單位 WCUs) 的成本。