本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker JumpStart 行業:金融
使用產 SageMaker JumpStart 業:財務解決方案、模型和範例筆記本,透過精心策劃的單步驟解決方案和以產業為重點的機器學習 (ML) 問題的範例筆記本,瞭解 SageMaker 功能和功能。這些筆記本也會逐步介紹如何使用 SageMaker JumpStart 產業 Python SDK 來增強產業文字資料,並微調預先訓練的模型。
主題
Amazon SageMaker JumpStart 行業 Python SDK
SageMaker 執行階段 JumpStart 提供了處理工具,可透過稱為工業 Python SDK 的用戶端程式庫來規劃產 SageMaker JumpStart 業資料集和微調預先訓練的模型。如需 SDK 的詳細 API 文件,以及進一步瞭解如何處理和增強產業文字資料集以改善 state-of-the-art 模型的效能 SageMaker JumpStart,請參閱SageMaker JumpStart產業 Python SDK 開放原始碼文件
Amazon SageMaker JumpStart 行業:金融解決方
SageMaker JumpStart 產業:金融提供下列解決方案筆記型電腦:
-
企業信用評等預測
這個 SageMaker JumpStart 行業:財務解決方案為文本增強的企業信用評級模型提供了一個模板。其顯示如何採用根據數值特徵 (在此情況下,Altman 著名的 5 財務比率) 與 SEC 文件中的文字相結合的模型,達成信用評等的預測改進。除了 5 個 Altman 比率之外,您還可以視需要新增更多變數或設定自訂變數。此解決方案筆記本顯示工 SageMaker JumpStart 業 Python SDK 如何協助處理 SEC 檔案中文字的自然語言處理 (NLP) 評分。此外,該解決方案示範如何使用增強型資料集來訓練模型以實現 best-in-class 模型、將模型部署到 SageMaker 端點進行生產,以及即時接收改進的預測。
-
以圖形為基礎的信用評分
傳統上使用財務報表資料和市場資料的模型產生信用評等,其僅為表格式 (數值和分類)。該解決方案使用 SEC 文件
注意
解決方案筆記本僅供示範用途。不應視為財務或投資建議。
您可以通過工作室經典 SageMaker JumpStart 頁面找到這些金融服務解決方案。
重要
截至 2023 年 11 月 30 日,以前的 Amazon SageMaker 工作室體驗現在被命名為 Amazon SageMaker 工作室經典。下面的部分是特定於使用 Studio 傳統版應用程序。如需使用更新後的 Studio 體驗的相關資訊,請參閱Amazon SageMaker 一室。
注意
SageMaker JumpStart 產業:財務解決方案、模型卡和範例筆記本只能透過 SageMaker Studio Classic 託管和執行。登入SageMaker 主控台
Amazon SageMaker JumpStart 產業:財務模型
SageMaker JumpStart 行業:金融提供以下預先訓練的強勁優化 BERT 方法(Rober
-
金融文字內嵌項目 (RoBERTa-SEC-Base)
-
RoBERTa-SEC-WIKI-Base
-
RoBERTa-SEC-Large
-
RoBERTa-SEC-WIKI-Large
RoBERTa-SEC-Base 和 RoBERTa-SEC-Large 模型是以 GluonNLP 的 RoBERTa 模型
您可以導覽至「文字模型」節點,選擇「瀏覽所有文字模型」,然後篩選「ML 工作文字嵌入」,來在 SageMaker JumpStart 中找到這些模型。選取您選擇的型號後,可存取任何對應的筆記本。配對的筆記本將引導您瞭解如何針對多模態資料集上的特定分類工作進行微調預先訓練的模型,這些工作由 SageMaker JumpStart業界 Python SDK 增強。
注意
模型筆記僅供示範用途。不應被視為財務或投資建議。
下面的屏幕截圖顯示了通過工作室經典 SageMaker JumpStart 頁面提供的預先訓練的模型卡。
![](images/jumpstart/jumpstart-finance-models.png)
注意
SageMaker JumpStart 產業:財務解決方案、模型卡和範例筆記本只能透過 SageMaker Studio Classic 託管和執行。登入SageMaker 主控台
Amazon SageMaker JumpStart 行業:金融示例筆記本
SageMaker JumpStart 產業:Financial 提供下列範例筆記型電腦,展示針對以產業為重點的機器學習問題
-
財務 TabText 資料建構 — 此範例介紹如何使用 SageMaker JumpStart 業界 Python SDK 來處理 SEC 檔案,例如以 NLP 評分類型及其對應字詞清單為基礎的文字摘要和評分文字。若要預覽此筆記本內容,請參閱來自 SEC 文件和 NLP 評分的多模態資料集簡單建構
。 -
TabText 資料上的多模式 ML — 此範例說明如何將不同類型的資料集合併到稱為單一資料框, TabText 並執行多模態 ML。若要預覽此筆記本的內容,請參閱 TabText 資料框架上的 Machine Learning — 以薪資保護計畫為基礎的範例
。 -
SEC 檔案資料上的多類別 ML — 此範例顯示如何透過 SEC 檔案策劃的多模式 (TabText) 資料集來訓練 AutoGluon NLP 模型,以進行多類分類工作。根據 MDNA 文字欄,將 SEC 10K/Q 檔案分類為產業代碼
。
注意
範例筆記本僅供示範用途。不應被視為財務或投資建議。
注意
SageMaker JumpStart 產業:財務解決方案、模型卡和範例筆記本只能透過 SageMaker Studio Classic 託管和執行。登入SageMaker 主控台
若要預覽範例筆記本的內容,請參閱SageMaker JumpStart 產業 Python SDK 文件中的教學課程 — 財務
Amazon SageMaker JumpStart 行業:金融博客文章
如需使用「 SageMaker JumpStart 產業:金融解決方案」、「模型」、「範例」和「SDK」的完整應用,請參閱下列部落格文章:
Amazon SageMaker JumpStart 行業:金融相關研究
有關「 SageMaker JumpStart 產業:金融解決方案」的研究,請參閱下列論文:
Amazon SageMaker JumpStart 產業:財務額外資源
如需其他文件和教學課程,請參閱以下資源: