載入資料 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

載入資料

COPY 命令是載入資料表的最有效方式。您也可以使用 INSERT 命令將資料新增至您的資料表,但與使用 COPY 相較,此方式效率明顯較低。COPY 命令能夠同時從多個數據文件或多個數據流中讀取。Amazon Redshift 會對叢集節點配置工作負載,parallel 且並行執行載入操作,包括排序資料列和在節點配量間配送資料。

注意

Amazon Redshift Spectrum 外部資料表是唯讀的。您無法 COPY 或 INSERT 至外部資料表。

訪問其他AWS資源時,您的叢集必須具備許可以存取這些資源和執行必要的動作來存取資料。您可以使用 Identity and Access Management (IAM) 來限制使用者對您的叢集資源和資料所具備的存取。

初始資料載入之後,如果您新增、修改或刪除大量資料,在刪除之後,您後續應該執行 VACUUM 命令來重新組織您的資料和回收空間。您也應該執行 ANALYZE 命令來更新資料表統計資料。

本節說明如何載入資料和對資料載入進行故障診斷,以及呈現用於載入資料的最佳實務。