本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 COPY 命令載入資料
主題
COPY 命令會利用 Amazon Redshift 大量 parallel 處理 (MPP) 架構,從 Amazon S3 上的檔案、從 DynamoDB 資料表,或從來自一或多個遠端主機的文字輸出 parallel 讀取和載入資料。
我們強烈建議使用 COPY 命令來載入大量資料。使用個別 INSERT 陳述式填入資料表的速度可能會相當慢。或者,如果您的資料已存在於其他 Amazon Redshift 資料表中,請使用 INSERT INTO... SELECT 或 CREATE TABLE AS 來改善效能。如需詳細資訊,請參閱 INSERT 或 CREATE TABLE AS。
從另一個AWS資源,您的叢集必須具備存取資源和執行必要的動作的權限。
若要授予或撤銷使用 COPY 命令將資料載入至資料表的權限,請授予或撤銷 INSERT 權限。
您的資料必須採用適當的格式,才能載入至您的 Amazon Redshift 資料表。本節介紹用於在載入資料之前準備和驗證資料,以及在運行之前驗證 COPY 陳述式的準則。
若要保護您的檔案中的資訊,您可以在將資料檔案上傳至您的 Amazon S3 儲存貯體之前將它加密;COPY 將會在執行載入時解密資料。您也可以對使用者提供暫時的安全性登入資料,來限制對您的載入資料的存取。暫時安全性登入資料提供加強的安全性,因為有效期限較短,且過期之後不能重複使用。
Amazon Redshift 具有內置於 COPY 的功能,可快速加載未壓縮的分隔數據。但您可以使用 gzip、lzop 或 bzip2 壓縮檔案來節省上傳檔案的時間。
如果 COPY 查詢中包含以下關鍵字,則不支持自動拆分未壓縮數據:轉義,刪除報價和固定寬度。但支持 CSV 關鍵字。
為了幫助確保數據在AWS雲端,Amazon Redshift 會使用硬體加速的 SSL 來與 Amazon S3 或 Amazon DynamoDB 通訊,以進行 COPY、UNLOAD、備份和還原操作。
直接從 Amazon DynamoDB 資料表載入您的資料表時,您可以選擇控制所使用的 Amazon DynamoDB 配置的輸送容量。
您可以選擇性地讓 COPY 分析您的輸入資料,和隨著載入程序自動套用最佳壓縮編碼至您的資料表。