使用 AWS 資料管道 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 AWS 資料管道

Notice (注意)

AWS Data Pipeline 不再提供給新客戶。的現有客戶 AWS Data Pipeline 可以繼續正常使用服務。進一步了解

AWS Data Pipeline 是一種 Web 服務,可用來自動化資料移動和轉換。您可以使用資料管道建立管道,從來源帳戶匯出資料表資料。匯出的資料會存放在目標帳戶中的 Amazon Simple Storage Service (Amazon S3) 儲存貯體中。目標帳戶中的 S3 儲存貯體必須可從來源帳戶存取。若要允許此跨帳戶存取,請更新目標 S3 儲存貯體中的存取控制清單 (ACL)。

在目標帳戶中建立另一個管道 (Account-B),將資料從 S3 儲存貯體匯入目標帳戶中的資料表。

這是將 Amazon DynamoDB 資料表備份至 Amazon S3 的傳統方法,並從 Amazon S3 還原,直到 AWS Glue 引入原生讀取 DynamoDB 資料表的支援。

優點

  • 這是無伺服器解決方案。

  • 不需要新的程式碼。

  • AWS Data Pipeline 會在任務的場景後方使用 Amazon EMR 叢集,因此此方法非常有效率,可以處理大型資料集。

缺點

  • 需要 AWS 其他服務 (資料管道和 Amazon S3)。

  • 程序會在來源資料表和涉及的目標資料表上耗用佈建的輸送量,因此可能會影響效能和可用性。

  • 此方法會產生額外的成本,超過 DynamoDB 讀取容量單位 (RCUs) 和寫入容量單位 WCUs) 的成本。