載入資料 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

載入資料

COPY 命令是載入資料表的最有效方式。您也可以使用 INSERT 命令將資料新增至您的資料表,但與使用 COPY 相較,此方式效率明顯較低。COPY 命令能夠同時從多個資料檔案或多個資料串流中進行讀取。Amazon Redshift 會將工作負載配置到叢集節點並平行執行載入作業,包括排序資料列和在節點配量間配送資料。

注意

Amazon Redshift Spectrum 外部資料表處於唯讀狀態。您無法 COPY 或 INSERT 至外部資料表。

若要存取其他 AWS 資源上的資料,您的叢集必須具有存取這些資源的權限,以及執行必要動作才能存取資料。您可以使用 AWS Identity and Access Management (IAM) 限制使用者對叢集資源和資料的存取權限。

初始資料載入之後,如果您新增、修改或刪除大量資料,在刪除之後,您後續應該執行 VACUUM 命令來重新組織您的資料和回收空間。您也應該執行 ANALYZE 命令來更新資料表統計資料。

本節說明如何載入資料和對資料載入進行故障診斷,以及呈現用於載入資料的最佳實務。