監督式微調 (Full FT、PEFT) - Amazon Nova

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監督式微調 (Full FT、PEFT)

監督式微調 (SFT) 是將提示回應對集合提供給基礎模型的程序,以改善特定任務上預先訓練基礎模型的效能。標記的範例會格式化為提示-回應對,並片語為指示。此微調程序會改變模型的權重。

當您有需要提供特定提示回應對以獲得最佳結果的網域特定資料時,您應該使用 SFT。完整排名 SFT 和參數效率 SFT 皆可使用。

如需搭配 Amazon Nova 模型自訂使用 SFT 的詳細說明,請參閱 SageMakeruser 指南中的監督微調 (完整 FT、PEFT) 一節。