在 Amazon Redshift 中使用 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Amazon Redshift 中使用

Amazon Redshift 機器學習 (Amazon Redshift ML) 是一種強大的雲端型服務,可讓各種技能等級的分析師和資料科學家更輕鬆地使用機器學習技術。您可以將想要訓練模型的資料,以及與資料輸入相關聯的中繼資料提供給 Amazon Redshift。然後,Amazon Redshift ML 會建立可擷取輸入資料中模式的模型。然後,您可以使用這些模型來產生新輸入資料的預測,而不會產生額外費用。

Amazon Redshift ML 如何與亞馬遜一起工作 SageMaker

Amazon Redshift 與亞馬遜 SageMaker 自動駕駛儀合作,以自動獲得最佳模型,並在 Amazon Redshift 中使用預測功能。

下圖說明 Amazon Redshift ML 的運作方式。

一般工作流程如下:

  1. Amazon Redshift 將訓練資料匯出至 Amazon S3。

  2. Amazon SageMaker 自動輔助駕駛會預先處理訓練資料。預處理執行重要功能,例如輸入缺少值。它認識到某些列是分類的(例如郵政編碼),正確格式化它們以進行培訓,並執行許多其他任務。選擇要套用於訓練資料集的最佳預處理器本身就是個問題,而 Amazon SageMaker Autopilot 會自動執行解決方案。

  3. Amazon SageMaker Autopilot 會尋找演算法和演算法超參數,以最準確的預測提供模型。

  4. Amazon Redshift 將預測函數註冊為您的 Amazon Redshift 叢集中的 SQL 函數。

  5. 當您執行建立模型陳述式時,Amazon Redshift 會使用亞馬遜 SageMaker 進行訓練。因此,訓練模型會產生相關的成本。這是您AWS帳單 SageMaker 中亞馬遜的單獨商品項目。您也需要支付 Amazon S3 用於存放訓練資料的儲存費用。使用可在 Redshift 叢集上編譯和執行的 CREATE MODEL 建立的模型的推論不收費。使用 Amazon Redshift ML 不會收取額外的 Amazon Redshift 費用。