持續從 Amazon S3 擷取檔案 (預覽) - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

持續從 Amazon S3 擷取檔案 (預覽)

這是預覽版本中的自動複製 (SQL 複製工作) 的發行前文件。文件和功能會隨時變更。我們建議僅在測試環境中使用此功能,不要在生產環境中使用。公開預覽將於 2024 年 7 月 31 日結束。預覽叢集將在預覽版結束的兩週後自動移除。如需預覽版條款和條件,請參閱 AWS 服務條款中的 Beta 版和預覽版
注意

您可以在預覽版中建立 Amazon Redshift 叢集,以測試 Amazon Redshift 的新功能。您無法在生產環境中使用這些功能,也無法將預覽叢集移至生產叢集或其他軌道上的叢集。如需了解預覽版條款和條件,請參閱 AWS 服務條款中的 Beta 版和預覽版

建立預覽版叢集
  1. 登入 AWS Management Console 並開啟 Amazon Redshift 主控台,網址為 https://console.aws.amazon.com/redshiftv2/

  2. 在導覽功能表上,選擇佈建叢集儀表板,然後選擇叢集。 AWS 區域 會列出目前帳戶的叢集。每個叢集的屬性子集會在清單中分欄顯示。

  3. 叢集清單頁面上會顯示一個介紹預覽版的橫幅。選擇建立預覽叢集按鈕以開啟 [建立叢集] 頁面。

  4. 輸入叢集的內容。選擇預覽軌道,其中包含您想要測試的功能。建議您輸入叢集名稱,以表示叢集位於預覽軌道上。針對您要測試的功能選擇叢集選項,包括標記為 -preview 的選項。如需有關建立叢集的一般資訊,請參閱《Amazon Redshift 管理指南》中的建立叢集

  5. 選擇建立叢集按鈕以建立預覽叢集。

  6. 當您的預覽叢集可用時,請使用 SQL 用戶端載入和查詢資料。

您的叢集必須使用名為 preview_2023 的預覽軌道建立。使用新叢集進行測試時,不支援將叢集還原至此軌道。自動複製功能不適用於 Amazon Redshift Serverless 工作群組。

此預覽可在下列項目中使用 AWS 區域:

  • 美國東部 (俄亥俄) 區域 (us-east-2)

  • 美國東部 (維吉尼亞北部) 區域 (us-east-1)

  • 美國西部 (奧勒岡) 區域 (us-west-2)

  • 亞太區域 (東京) 區域 (ap-northeast-1)

  • 歐洲 (斯德哥爾摩) 區域 (eu-north-1)

  • 歐洲 (愛爾蘭) 區域 (eu-west-1)

您可以使用 COPY JOB,將資料從儲存在 Amazon S3 中的檔案載入您的 Amazon Redshift 資料表。Amazon Redshift 會偵測新的 Amazon S3 檔案何時新增至 COPY 命令中指定的路徑。然後,COPY 命令會自動執行,您不必建立外部資料擷取管道。Amazon Redshift 會追蹤哪些檔案已載入完成。Amazon Redshift 會決定每個 COPY 命令批次處理的檔案數量。您可以在系統檢視中看到產生的 COPY 命令。

您只會定義 COPY JOB 一次。之後的執行會使用相同參數。

您可以使用 CREATE、LIST、SHOW、DROP、ALTER 和 RUN 工作的選項來管理載入操作。如需詳細資訊,請參閱 COPY JOB (預覽)

您可以查詢系統檢視以查看 COPY JOB 狀態和進度。提供的視圖如下:

若要取得由 COPY JOB 載入的檔案清單,請執行下列範例並取代 <job_id>

SELECT job_id, job_name, data_source, copy_query,filename,status, curtime FROM sys_copy_job copyjob JOIN stl_load_commits loadcommit ON copyjob.job_id = loadcommit.copy_job_id WHERE job_id = <job_id>;