AI21 Labs Jurassic-2 模型

RSS

聚焦模式

AI21 Labs Jurassic-2 模型 - Amazon Bedrock

推理参数代码示例

本节提供推理参数和用于使用的代码示例 AI21 Labs AI21 Labs Jurassic-2 模型。

主题

推理参数
代码示例

推理参数

这些区域有：AI21 Labs Jurassic-2 模型支持以下推理参数。

主题

随机性和多样性
Length
重复
模型调用请求正文字段
模型调用响应正文字段

随机性和多样性

这些区域有：AI21 Labs Jurassic-2 模型支持以下参数来控制响应的随机性和多样性。

Temperature (temperature) – 使用较低的值可降低响应中的随机性。
Top P (topP) – 使用较低的值可忽略不太可能的选项。

Length

这些区域有：AI21 Labs Jurassic-2 模型支持以下参数来控制生成的响应的长度。

Max completion length (maxTokens) – 指定生成的响应中的最大令牌数。
Stop sequences (stopSequences) – 配置模型可识别的停止序列，遇到停止序列后，模型停止生成更多令牌。按 Enter 键可在停止序列中插入换行符。使用 Tab 键结束对停止序列的插入。

重复

这些区域有：AI21 Labs Jurassic-2 模型支持以下参数来控制生成的响应中的重复性。

Presence penalty (presencePenalty) – 使用较高的值可降低生成的新令牌已在提示或完成内容中至少出现过一次的概率。
Count penalty (countPenalty) – 使用较高的值可降低生成的新令牌已在提示或完成内容中至少出现过一次的概率。与出现次数成正比。
Frequency penalty (frequencyPenalty) – 使用较高的值可降低生成的新令牌已在提示或完成内容中至少出现过一次的概率。此值与令牌出现的频率成正比（标准化为文本长度）。
Penalize special tokens — 降低特殊字符重复出现的概率。默认值为 true。
- Whitespaces (applyToWhitespaces) – true 值会将惩罚应用于空格和新行。
- Punctuations (applyToPunctuation) – true 值会将惩罚应用于标点。
- Numbers (applyToNumbers) – true 值会将惩罚应用于数字。
- Stop words (applyToStopwords) – true 值会将惩罚应用于停顿词。
- Emojis (applyToEmojis) – true 值且将表情符号排除在惩罚范围之外。

模型调用请求正文字段

当你使用InvokeModelWithResponseStream拨打InvokeModel或打电话时 AI21 Labs 模型，在body字段中填入符合以下内容的 JSON 对象。在 prompt 字段中输入提示。


{
    "prompt": string,
    "temperature": float,
    "topP": float,
    "maxTokens": int,
    "stopSequences": [string],
    "countPenalty": {
        "scale": float
    },
    "presencePenalty": {
        "scale": float
    },
    "frequencyPenalty": {
        "scale": float
    }
}

要惩罚特殊令牌，请将这些字段添加到任何惩罚对象中。例如，您可以按如下方式修改 countPenalty 字段。


"countPenalty": {
    "scale": float,
    "applyToWhitespaces": boolean,
    "applyToPunctuations": boolean,
    "applyToNumbers": boolean,
    "applyToStopwords": boolean,
    "applyToEmojis": boolean
}

下表显示了数字参数的最小值、最大值和默认值。

类别	参数	JSON 对象格式	最大值	默认
随机性和多样性	Temperature	温度	1	0.5
随机性和多样性	Top P	topP	1	0.5
Length	Max tokens (mid, ultra, and large models)	maxTokens	8,191	200
Length	Max tokens (other models)	maxTokens	2,048	200
重复	Presence penalty	presencePenalty	5	0
	Count penalty	countPenalty	1	0
	Frequency penalty	frequencyPenalty	500	0

模型调用响应正文字段

有关响应中body字段格式的信息，请参阅 https://docs.ai21.com/reference/j2-complete-api-ref。

注意

Amazon Bedrock 会以整数值的形式返回响应标识符（id）。

代码示例

此示例说明如何调用 A2I AI21 Labs Jurassic-2 Mid模型。


import boto3
import json

brt = boto3.client(service_name='bedrock-runtime')

body = json.dumps({
    "prompt": "Translate to spanish: 'Amazon Bedrock is the easiest way to build and scale generative AI applications with base models (FMs)'.", 
    "maxTokens": 200,
    "temperature": 0.5,
    "topP": 0.5
})

modelId = 'ai21.j2-mid-v1'
accept = 'application/json'
contentType = 'application/json'

response = brt.invoke_model(
    body=body, 
    modelId=modelId, 
    accept=accept, 
    contentType=contentType
)

response_body = json.loads(response.get('body').read())

# text
print(response_body.get('completions')[0].get('data').get('text'))

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

AI21 Labs 模型

AI21 Labs Jamba 模特

下一主题：

AI21 Labs Jamba 模特

上一主题：

AI21 Labs 模型

需要帮助吗？

本页内容

选择您的 Cookie 首选项

自定义 Cookie 首选项

关键

性能

功能

广告

无法保存 Cookie 首选项