步驟 6:執行 COPY 命令以載入資料 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

步驟 6:執行 COPY 命令以載入資料

執行COPY命令以連線至 Amazon EMR 叢集,並將資料載入至 Amazon Redshift 資料表。Amazon EMR 叢集必須繼續執行,直到 COPY 命令完成。例如,請勿將叢集設定為自動終止。

重要

如果 COPY 完成之前有任何資料檔案變更或刪除,可能會發生非預期的結果,COPY 操作也可能失敗。

在 COPY 命令中,指定 Amazon EMR 叢集 ID 和 HDFS 檔案路徑和檔案名稱。

copy sales from 'emr://myemrclusterid/myoutput/part*' credentials iam_role 'arn:aws:iam::0123456789012:role/MyRedshiftRole';

您可以在檔案名稱引數中使用萬用字元星號 (*) 和問號 (?)。例如,part* 會載入檔案 part-0000part-0001,以此類推。如果僅指定資料夾名稱,COPY 會嘗試載入該資料夾中的所有檔案。

重要

如果使用萬用字元或只使用資料夾名稱,請確認不會載入不需要的檔案,否則 COPY 命令將會失敗。例如,某些程序可能將日誌檔案寫入至輸出資料夾。