在 Studio 中使用基礎模型 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Studio 中使用基礎模型

您可以直接透過 Amazon SageMaker Studio UI 微調、部署和評估公開可用和專有的 JumpStart 基礎模型。

重要

截至 2023 年 11 月 30 日,以前的 Amazon SageMaker 工作室體驗現在被命名為 Amazon SageMaker 工作室經典。以下部分專門針對使用更新的 Studio 體驗。如需有關使用 Studio 典型應用程式的資訊,請參閱Amazon 經典 SageMaker 一室

在 Amazon SageMaker Studio 中,透過首 JumpStart 頁或左側面板的選單開啟登陸頁面。這會開啟SageMaker JumpStart登陸頁面,您可以在其中瀏覽模型中樞並搜尋模型。

  • JumpStart在 [首頁] 面中,選擇 [預先建置和自動化解決方案] 窗格中的。

  • 從左側面板的「首頁」功能表中,導覽至JumpStart節點。

如需開始使用 Amazon SageMaker 工作室的詳細資訊,請參閱Amazon SageMaker 一室

從 Studio 的SageMaker JumpStart登陸頁面,您可以從公開可用和專有模型的提供者探索模型中樞。您可以使用搜索欄查找特定的集線器或型號。在每個模型中心內,您可以直接搜尋模型、依「最喜歡」、「最多下載次數」或「最近更新」排序,或根據提供的模型工作清單進行篩選。選擇一個模型以查看其模型詳細信息卡。在模型詳細資料卡片的右上角,選擇「微調」、「部」或「評估」,分別開始進行微調、部署或評估工作流程。請注意,並非所有型號都可用於微調或評估。

在 Studio 中微調基礎模型

微調會在新資料集上訓練預先訓練的模型,而不需要從頭開始訓練。這個程序也稱為移轉學習,可以利用較小的資料集和較短的訓練時間來產生精確的模型。若要微調 JumpStart基礎模型,請導覽至 Studio UI 中的模型詳細資料卡片。如需如何 JumpStart 在 Studio 中開啟的詳細資訊,請參閱 JumpStart 在工作室中打開並使用。瀏覽至您選擇的模型詳細資訊卡後,選擇右上角的「訓練」。請注意,並非所有型號都有可用的微調功能。

重要

某些基礎模型需要在微調之前明確接受使用者授權合約 (EULA)。如需詳細資訊,請參閱 在 Amazon SageMaker 工作室接受 EULA

模型設定

在 Amazon SageMaker Studio 中使用預先訓練的 JumpStart 基礎模型時,依預設會填入模型成品位置 (Amazon S3 URI)。若要編輯預設的 Amazon S3 URI,請選擇 [輸入模型人工因素位置]。並非所有模型都支援變更模型人工因素位置。

資料設定

在「資」欄位中,提供一個 Amazon S3 URI 指向您的訓練資料集位置。預設的 Amazon S3 URI 會指向範例訓練資料集。若要編輯預設的 Amazon S3 URI,請選擇 [輸入訓練資料集] 並變更 URI。請務必檢閱 Amazon SageMaker Studio 中的模型詳細資料卡,以取得有關格式化訓練資料的資訊。

超參數

您可以自訂用於微調模型的訓練工作的超參數。每個可微調模型的可用超參數視模型而有所不同。

以下超參數在模型中很常見:

  • 時期 - 一個時期是整個資料集的一個循環。一個批次包括多個間隔,多個批次最終組成一個時期。執行多個週期,直到模型的精準度達到可接受的程度,或者當誤差率降至可接受的程度以下為止。

  • 學習速率 - 值應該在時期之間改變的量。在改良模型時,會推動其內部權重,並檢查錯誤率以查看模型是否有所改善。典型的學習速率是 0.1 或 0.01,其中 0.01 是較小的調整,可能會導致訓練需要很長時間才能收斂,而 0.1 則大得多,可能導致訓練過衝。它是您可以調整以訓練模型的主要超參數之一。請注意,針對文字模型,較小的學習速率要 (BERT 為 5e-5) 可能會帶來更準確的模型。

  • Batch 大小 - 每個間隔從資料集中選擇要傳送到 GPU 進行訓練的記錄數。

檢閱 Studio UI 中模型詳細資料卡中的工具提示提示和其他資訊,以進一步瞭解您所選模型特定的超參數。

如需可用超參數的詳細資訊,請參閱常見支援的微調超參數

部署

指定訓練工作的訓練執行個體類型和輸出成品位置。在微調 Studio UI 中,您只能從與您選擇的模型相容的執行個體中進行選擇。預設輸出人工因素位置為 SageMaker 預設值區。若要變更輸出成品位置,請選擇 [輸入輸出成品位置],然後變更 Amazon S3 URI。

安全

指定用於訓練工作的安全性設定,包括 SageMaker 用來訓練模型的 IAM 角色、訓練工作是否應連線到虛擬私有雲 (VPC),以及用於保護資料安全的任何加密金鑰。

其他資訊

在「其他資訊」欄位中,您可以編輯訓練工作名稱。您也可以以索引鍵值配對的形式新增和移除標籤,以協助組織和分類您的微調訓練工作。

提供微調組態的資訊之後,請選擇「送出」。如果您選擇微調的預先訓練基礎模型需要在訓練前明確同意使用者授權合約 (EULA),則會在快顯視窗中提供 EULA。若要接受 EULA 的條款,請選擇「接受」。在下載或使用模型之前,您有責任審查並遵守任何適用的授權條款,並確保這些條款適用於您的使用案例。

在 Studio 中部署基礎模型

若要部署 JumpStart 基礎模型,請導覽至 Studio UI 中的模型詳細資料卡片。如需如何 JumpStart 在 Studio 中開啟的詳細資訊,請參閱 JumpStart 在工作室中打開並使用。瀏覽至您選擇的模型詳細資料頁面後,選擇 Studio UI 右上角的部署。然後,按照使用 SageMaker Studio 部署模型中的步驟進行操作

重要

某些基礎模型需要在部署之前明確接受使用者授權合約 (EULA)。如需詳細資訊,請參閱 在 Amazon SageMaker 工作室接受 EULA

在 Studio 中評估基礎模型

Amazon 與 SageMaker JumpStart SageMaker 澄清基礎模型評估(FME)在工作室集成。如果 JumpStart 模型具有可用的內建評功能,您可以選擇 JumpStart Studio UI 模型詳細資訊頁面右上角的「評估」。如需詳細資訊,請參閱評估基礎模型