使用 COPY 命令載入資料 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 COPY 命令載入資料

COPY 命令會利用 Amazon Redshift 大量平行處理 (MPP) 架構從 Amazon S3 上的檔案、從 DynamoDB 資料表,或從一或多個遠端主機的文字輸出平行讀取和載入資料。

注意

我們強烈建議使用 COPY 命令來載入大量資料。使用個別 INSERT 陳述式填入資料表的速度可能會相當慢。或者,如果您的資料已存在於其他 Amazon Redshift 資料庫資料表中,請使用 INSERT INTO ... SELECT 或 CREATE TABLE AS 來改善效能。如需詳細資訊,請參閱 INSERTCREATE TABLE AS

若要從其他 AWS 資源載入資料,您的叢集必須具有存取資源和執行必要動作的權限。

若要授予或撤銷使用 COPY 命令將資料載入至資料表的權限,請授予或撤銷 INSERT 權限。

您的資料必須採用適當的格式,才能載入至您的 Amazon Redshift 資料表。本節說明用於在載入您的資料之前準備和驗證資料,以及執行之前用於驗證 COPY 陳述式的準則。

若要保護您的檔案中的資訊,您可以先將資料檔案加密再將其上傳至您的 Amazon S3 儲存貯體;COPY 會在執行載入時解密資料。您也可以對使用者提供暫時的安全性登入資料,來限制對您的載入資料的存取。暫時安全性登入資料提供加強的安全性,因為有效期限較短,且過期之後不能重複使用。

Amazon Redshift 具有內建的 COPY 功能,可快速載入未壓縮的已分隔資料。但您可以使用 gzip、lzop 或 bzip2 壓縮檔案來節省上傳檔案的時間。

如果 COPY 查詢中有下列關鍵字,則不支援自動分割未壓縮的資料:ESCAPE、REMOVEQUOTES 和 FIXEDWIDTH。但是支援 CSV 關鍵字。

為了協助確保您在 AWS 雲端傳輸中的資料安全,Amazon Redshift 使用硬體加速 SSL 與 Amazon S3 或 Amazon DynamoDB 通訊,以進行複製、卸載、備份和還原作業。

直接從 Amazon DynamoDB 資料表載入您的資料表時,您可以選擇控制所使用的 Amazon DynamoDB 佈建輸送量。

您可以選擇性地讓 COPY 分析您的輸入資料,和隨著載入程序自動套用最佳壓縮編碼至您的資料表。