本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
AI21 LabsJurassic-2模型
本节提供推理参数和使用AI21 LabsAI21 LabsJurassic-2模型的代码示例。
推理参数
这些AI21 LabsJurassic-2模型支持以下推理参数。
随机性和多样性
这些AI21 LabsJurassic-2模型支持以下参数来控制响应的随机性和多样性。
-
Temperature (
temperature
) – 使用较低的值可降低响应中的随机性。 -
Top P (
topP
) – 使用较低的值可忽略不太可能的选项。
Length
这些AI21 LabsJurassic-2模型支持以下参数来控制生成的响应的长度。
-
Max completion length (
maxTokens
) – 指定生成的响应中的最大令牌数。 -
Stop sequences (
stopSequences
) – 配置模型可识别的停止序列,遇到停止序列后,模型停止生成更多令牌。按 Enter 键可在停止序列中插入换行符。使用 Tab 键结束对停止序列的插入。
重复
这些AI21 LabsJurassic-2模型支持以下参数来控制生成的响应中的重复性。
-
Presence penalty (
presencePenalty
) – 使用较高的值可降低生成的新令牌已在提示或完成内容中至少出现过一次的概率。 -
Count penalty (
countPenalty
) – 使用较高的值可降低生成的新令牌已在提示或完成内容中至少出现过一次的概率。与出现次数成正比。 -
Frequency penalty (
frequencyPenalty
) – 使用较高的值可降低生成的新令牌已在提示或完成内容中至少出现过一次的概率。此值与令牌出现的频率成正比(标准化为文本长度)。 -
Penalize special tokens — 降低特殊字符重复出现的概率。默认值为
true
。-
Whitespaces (
applyToWhitespaces
) –true
值会将惩罚应用于空格和新行。 -
Punctuations (
applyToPunctuation
) –true
值会将惩罚应用于标点。 -
Numbers (
applyToNumbers
) –true
值会将惩罚应用于数字。 -
Stop words (
applyToStopwords
) –true
值会将惩罚应用于停顿词。 -
Emojis (
applyToEmojis
) –true
值且将表情符号排除在惩罚范围之外。
-
模型调用请求正文字段
使用AI21 Labs模型进行InvokeModel或InvokeModelWithResponseStream调用时,请在body
字段中填入符合以下对象的 JSON 对象。在 prompt
字段中输入提示。
{ "prompt": string, "temperature": float, "topP": float, "maxTokens": int, "stopSequences": [string], "countPenalty": { "scale": float }, "presencePenalty": { "scale": float }, "frequencyPenalty": { "scale": float } }
要惩罚特殊令牌,请将这些字段添加到任何惩罚对象中。例如,您可以按如下方式修改 countPenalty
字段。
"countPenalty": { "scale": float, "applyToWhitespaces": boolean, "applyToPunctuations": boolean, "applyToNumbers": boolean, "applyToStopwords": boolean, "applyToEmojis": boolean }
下表显示了数字参数的最小值、最大值和默认值。
类别 | 参数 | JSON 对象格式 | 最低 | 最高 | 默认 |
---|---|---|---|---|---|
随机性和多样性 | Temperature | 温度 | 0 | 1 | 0.5 |
Top P | topP | 0 | 1 | 0.5 | |
Length | Max tokens (mid, ultra, and large models) | maxTokens | 0 | 8,191 | 200 |
Max tokens (other models) | 0 | 2,048 | 200 | ||
重复 | Presence penalty | presencePenalty | 0 | 5 | 0 |
Count penalty | countPenalty | 0 | 1 | 0 | |
Frequency penalty | frequencyPenalty | 0 | 500 | 0 |
模型调用响应正文字段
有关响应中的 body
字段的格式的信息,请参阅 https://docs.ai21.com/reference/j2-complete-ref
注意
Amazon Bedrock 以整数值的形式返回响应标识符 (id
)。
代码示例
此示例说明如何调用 A2I 模型AI21 LabsJurassic-2 Mid。
import boto3 import json brt = boto3.client(service_name='bedrock-runtime') body = json.dumps({ "prompt": "Translate to spanish: 'Amazon Bedrock is the easiest way to build and scale generative AI applications with base models (FMs)'.", "maxTokens": 200, "temperature": 0.5, "topP": 0.5 }) modelId = 'ai21.j2-mid-v1' accept = 'application/json' contentType = 'application/json' response = brt.invoke_model( body=body, modelId=modelId, accept=accept, contentType=contentType ) response_body = json.loads(response.get('body').read()) # text print(response_body.get('completions')[0].get('data').get('text'))