從 Amazon DynamoDB 複製 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

從 Amazon DynamoDB 複製

若要從現有 DynamoDB 資料表載入資料,請使用 FROM 子句來指定 DynamoDB 資料表名稱。

重要

如果 DynamoDB 表格與 Amazon Redshift 叢集不在同一個區域中,您必須使用 REGION 參數來指定資料所在的區域。

語法

FROM 'dynamodb://table-name' authorization READRATIO ratio | REGION [AS] 'aws_region' | optional-parameters

範例

下列範例會從 DynamoDB 資料表載入資料。

copy favoritemovies from 'dynamodb://ProductCatalog' iam_role 'arn:aws:iam::0123456789012:role/MyRedshiftRole' readratio 50;

參數

FROM

載入的資料來源。

'dynamodb://table-name'

例如,包含資料之 DynamoDB 資料表的名稱。'dynamodb://ProductCatalog'如需 DynamoDB 屬性如何對應至 Amazon Redshift 資料行的詳細資訊,請參閱。從 Amazon DynamoDB 資料表載入資料

DynamoDB 表格名稱對於帳戶而言是唯一的,該AWS帳戶由AWS存取認證識別。

authorization

COPY 命令需要授權才能存取其他AWS資源中的資料,包括 Amazon S3、亞馬遜 EMR、DynamoDB 和 Amazon EC2。您可以參考附加到叢集的 AWS Identity and Access Management (IAM) 角色 (以角色為基礎的存取控制) 或提供使用者的存取登入資料 (以金鑰為基礎的存取控制) 來提供該授權。為了提高安全性和彈性,建議使用 IAM 角色型存取控制。如需詳細資訊,請參閱授權參數

READRATIO [AS] 比率

DynamoDB 表格佈建輸送量用於資料載入的百分比。從動態資料庫複製需要讀取率。它不能與從 Amazon S3 複製一起使用。強烈建議將此比率設定為小於平均未用佈建輸送量的值。有效值為整數 1—200。

重要

將 READRATION 設定為 100 或更高版本可讓 Amazon Redshift 消耗整個 DynamoDB 表格的佈建輸送量,這會嚴重降低 COPY 工作階段期間對同一表格的同時讀取操作的效能。寫入流量不受影響。當 Amazon Redshift 無法滿足表格的佈建輸送量時,允許高於 100 的值對罕見案例進行疑難排解。如果您持續將資料從 DynamoDB 載入到 Amazon Redshift,請考慮將 DynamoDB 表組織為時間序列,以將即時流量與 COPY 操作區隔開來。

選用參數

您可以選擇使用複製來自 Amazon DynamoDB 的影印指定下列參數:

不支援的參數

您無法將下列參數與從 DynamoDB 複製搭配使用:

  • 所有資料格式參數

  • ESCAPE

  • FILLRECORD

  • IGNOREBLANKLINES

  • IGNOREHEADER

  • NULL

  • REMOVEQUOTES

  • ACCEPTINVCHARS

  • MANIFEST

  • ENCRYPTED