機器學習 - AWS Step Functions

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

機器學習

機器學習可讓組織快速分析收集到的資料以識別模式,然後以最少的人為介入做出決策。機器學習始於一組初始的資料,稱為訓練資料。此訓練資料有助於提高機器學習模型的預測準確度,並作為此模型學習的基礎。一旦模型被認為足夠準確以滿足業務需求,它就會部署到生產環境中。AWS Step Functions資料科學軟體開發套件 (SDK) 是開放原始碼程式庫,可讓您輕鬆建立工作流程,以預先處理資料、訓練模型,然後使用 Amazon SageMaker 和 Step Functions 發佈模型。

預先處理現有資料集是組織經常建立訓練資料的方式。此方法會新增資訊,例如標示影像中的物件、註解文字或處理音訊。若要預先處理您可以使用的資料AWS Glue,或者您可以建立執行 Jupyter SageMaker Notebook 應用程式的筆記本執行個體。資料準備就緒後,即可將其上傳到 Amazon S3 以便輕鬆存取。由於機器學習模型經過訓練,您可以對每個模型的參數進行調整,以提高準確性,直到準備好部署為止。

Step Functions 可讓您在SageMaker上協調端對端機器學習工作流程。這些工作流程可以包括資料預處理、後處理、特徵工程、資料驗證和模型評估。將模型部署到生產環境後,您可以優化和測試新方法,以持續改善業務成果。您可以直接在 Python 中建立可供生產使用的工作流程,也可以使用 Step Functions 資料科學 SDK 複製該工作流程、試驗新選項,並將精細的工作流程置於生產環境中。

客戶使用 Step Functions 的某些機器學習工作流程類型包括:

詐騙偵測

  • 識別並防止詐騙交易發生,例如信用欺詐。

  • 使用訓練有素的機器學習模型偵測並防止帳戶遭到盜用。

  • 識別促銷濫用行為,包括建立虛假帳戶,以便您快速採取行動。

個人化與建議

  • 根據預測吸引他們的興趣,向目標客戶推薦產品。

  • 預測客戶是否要將其帳戶從免費方案升級為付費訂閱。

資料豐富

  • 使用資料擴充作為預先處理的一部分,為更準確的機器學習模型提供更好的訓練資料。

  • 註釋文本和音頻摘錄以添加語法信息,例如諷刺和俚語。

  • 在影像中標示其他物件,以提供重要資訊以供模型學習,例如物件是蘋果、籃球、岩石還是動物。