使用推論參數產生影響回應

執行模型推論時，您可以調整推論參數來影響模型回應。推論參數可以變更模型在產生期間考慮的可能輸出集區，也可以限制最終回應。

推論參數預設值和範圍取決於模型。若要了解不同模型的推論參數，請參閱基礎模型的推論請求參數和回應欄位。

下列類別的參數常見於不同的模型：

隨機性和多樣性

對於任何指定的序列，模型可決定序列中下一個字符選項的機率分佈。為了在輸出中產生每個字符，模型會從此分佈中進行取樣。隨機性和多樣性是指模型回應中的變體數量。您可以透過限制或調整分佈來控制這些係數。基礎模型通常支援以下參數來控制回應中的隨機性和多樣性。

溫度 — 影響預測輸出的機率分佈形狀，並影響模型選擇較低機率輸出的可能性。
- 選擇較低的值來影響模型，以選擇較高機率的輸出。
- 選擇較高的值來影響模型，以選取較低機率的輸出。
用技術性名詞來說，溫度會調節下一個字符的機率質量函數。較低的溫度會使函數變得陡峭，並導致更具確定性的回應，而較高的溫度會使函數變得平坦，並導致更隨機的回應。
Top K - 模型考慮下一個字符最有可能的候選項數量。
- 選擇較低的值以縮減集區的大小，並將選項限制為更可能的輸出。
- 選擇較高的值以增加集區的大小，並允許模型考慮較不可能的輸出。
例如，若為 Top K 選擇值 50，則模型會從 50 個最有可能成為序列中下一個的字符中做選擇。
Top P - 模型考慮下一個字符最有可能的候選項百分比。
- 選擇較低的值以縮減集區的大小，並將選項限制為更可能的輸出。
- 選擇較高的值以增加集區的大小，並允許模型考慮較不可能的輸出。
用技術性名詞來說，該模型會運算回應集的累積機率分佈，並僅考慮分佈的前 P%。

例如，若您為 Top P 選擇值 0.8，則模型會從可能是序列中下一個字符的機率分佈的前 80% 中做選擇。

下表摘要說明這些參數的功用。

做為用於了解這些參數的範例，請考慮範例提示 I hear the hoof beats of "。假設模型確定以下三個單字當做下一個字符的候選項。該模型也會為每個單字指派機率。


{
    "horses": 0.7,
    "zebras": 0.2,
    "unicorns": 0.1
}

如果設定較高的溫度，則機率分佈較平坦，機率差異會減小，這會增加選擇「獨角獸」的機率，並降低選擇「馬」的機率。
如果將 Top K 設為 2，則模型僅考慮前 2 名最有可能的候選項：「馬」和「斑馬」。
如果您將前 P 設定為 0.7，則模型只會考慮「馬」，因為它是唯一位於機率分佈前 70% 的候選者。如果您將前 P 設定為 0.9，模型會將「馬」和「斑馬」視為機率分佈的前 90%。

基礎模型通常會支援限制回應長度的參數。下方提供這些參數的範例。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

推論的運作方式

支援的區域和模型