面向新手和專家的機器學習 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

面向新手和專家的機器學習

使用 Amazon Redshift ML,您可以使用單個 SQL 創建模型命令來訓練模型。「創建模型」命令創建一個模型,Amazon Redshift 使用該模型來生成具有熟悉的 SQL 結構的基於模型的預測。

當您不具備機器學習、工具、語言、算法和 API 方面的專業知識時,Amazon Redshift ML 特別有用。使用 Amazon Redshift ML,您無需執行與外部機器學習服務集成所需的無差別繁重的工作。Amazon Redshift 為您節省了格式化和移動數據、管理權限控制或構建自定義集成、工作流程和腳本的時間。您可以輕鬆使用流行的機器學習算法,並簡化需要從培訓到預測的頻繁迭代的培訓需求。Amazon Redshift 會自動發現最佳算法,併為您的問題調整最佳模型。您可以從 Amazon Redshift 集羣中進行預測,無需將數據移出 Amazon Redshift,也無需與其他服務接口並支付其他服務費用。

Amazon Redshift ML 支持數據分析師和數據科學家使用機器學習。它還使機器學習專家可以利用他們的知識來指導 CREATE MODEL 語句僅使用他們指定的方面。通過這樣做,您可以加快 CREATE MODEL 找到最佳候選項所需的時間,提高模型的準確度,或者同時提高模型的準確性。

CREATE MODEL 語句在如何為培訓作業指定參數方面提供了靈活性。利用這種靈活性,機器學習新手或專家都可以選擇他們首選的預處理器、算法、問題類型和超參數。例如,對客户流失感興趣的用户可能會為 CREATE MODEL 語句指定問題類型是二進制分類,這適用於客户流失。然後,CREATE MODEL 語句將搜索最佳模型縮小為二進制分類模型。即使用户選擇了問題類型,CREATE MODEL 語句仍然可以使用許多選項。例如,CREATE MODEL 發現並應用最佳的預處理轉換,並發現最佳超參數設置。

Amazon Redshift ML 通過使用 Amazon SageMaker 自動駕駛儀自動找到最佳模型,使培訓變得更加輕鬆。在幕後,Amazon SageMaker 自動導航儀會根據您提供的數據自動訓練和調整最佳機器學習模型。然後,Amazon SageMaker Neo 編譯訓練模型,並使其可用於在您的 Redshift 集羣中進行預測。當您使用訓練有素的模型運行機器學習推理查詢時,查詢可以使用 Amazon Redshift 的大規模並行處理功能。同時,查詢可以使用基於機器學習的預測。

  • 作為Machine Learning 初學者,具有對機器學習的不同方面(如預處理器、算法和超參數)的一般知識,使用 CREATE MODEL 語句僅用於指定的方面。然後,您可以縮短 CREATE MODEL 找到最佳候選項所需的時間,或者提高模型的精度。此外,您還可以通過引入其他領域知識(如問題類型或目標)來提高預測的業務價值。例如,在客户流失情形中,如果結果「客户不活躍」很少,則 F1 目標通常優先於「準確性」目標。由於高精度模型可能會始終預測「客户處於活動狀態」,因此可能會導致高精度,但業務價值很小。有關 F1 目標的信息,請參閲自動噴射器中的Amazon SageMaker API 參考

    如需 CREATE MODEL 語句的基本選項的詳細資訊,請參簡易建立模型

  • 作為Machine Learning 高級執業人員,您可以為某些(但不是全部)功能指定問題類型和預處理器。然後,CREATE 模型遵循您對指定方面的建議。與此同時,CREATE MODEL 仍會發現剩餘特徵的最佳預處理器和最佳超參數。如需如何約束培訓管道的一個或多個方面的詳細資訊,請參使用用户指導創建模型

  • 作為Machine Learning 專家,您可以完全控制訓練和超參數調整。然後 CREATE MODEL 語句不會嘗試發現最佳預處理器、算法和超參數,因為您可以做出所有選擇。如需如何搭配自動關閉使用的建立模型的詳細資訊,請參創建具有自動關閉功能的 XGBoost 模型

  • 作為資料工程師,您可以在 Amazon SageMaker 中帶來一個預先訓練的 XGBoost 模型,並將其導入到 Amazon Redshift 進行本地推斷。隨着自己的模型 (BYOM),您可以在亞馬遜 Redshift 中使用 Amazon Redshift 之外培訓的模型在 Amazon SageMaker 馬 Amazon Redshift 中進行本地的數據庫推斷。Amazon Redshift ML 支持在本地或遠程推理中使用 BYOM。

    如需如何將 CREATE MODEL 語句用於本地或遠程推斷的詳細資訊,請參自帶自己的型號 (BYOM)

作為 Amazon Redshift ML 用户,您可以選擇以下任一選項來訓練和部署模型: