OpenAI 模型

OpenAI 提供下列開放權重模型：

gpt-oss-20b – 針對較低的延遲和本機或專門的使用案例進行最佳化的較小模型。
gpt-oss-120b – 針對生產和一般用途或高基礎使用案例進行最佳化的較大模型。

下表摘要說明模型的相關資訊：

資訊	gpt-oss-20b	gpt-oss-120b
版本日期	2025 年 8 月 5 日	2025 年 8 月 5 日
模型 ID	openai.gpt-oss-20b-1:0	openai.gpt-oss-120b-1:0
產品 ID	N/A	N/A
支援的輸入模式	文字	文字
支援的輸出模式	文字	文字
內容視窗	128，000	128，000

這些OpenAI模型支援下列功能：

具有下列操作的模型調用：
使用 CreateModelInvocationJob 進行批次推論。
透過在模型調用操作中使用標頭來保護使用 Amazon Bedrock Guardrails 偵測和篩選有害內容應用程式。

OpenAI 請求內文

如需有關請求內文中參數及其描述的資訊，請參閱 OpenAI 文件中的建立聊天完成。

以下列方式使用請求內文欄位：

在 InvokeModel 或OpenAI聊天完成請求中，包含請求內文中的欄位。

在 Converse 請求中，執行下列動作：

映射 messages，如下所示：
- 對於角色為的每個訊息developer，在system陣列中新增 content SystemContentBlock。
- 對於角色為 user或的每個訊息assistant，在 content 欄位中將 content新增至 ContentBlock，並在messages陣列role中訊息的 role 欄位中指定。

將下列欄位的值對應至inferenceConfig物件中的對應欄位：

OpenAI 欄位	Converse 欄位
max_completion_tokens	maxTokens
stop	stopSequences
溫度	溫度
top_p	topP

在 additionalModelRequestFields 物件中包含任何其他欄位。

建構請求內文時的考量事項

這些OpenAI模型僅支援文字輸入和文字輸出。
欄位的值model必須符合標頭中的值。您可以省略此欄位，讓它自動填入與標頭相同的值。
stream 欄位中的值必須符合您使用的 API 操作。您可以省略此欄位，讓它自動填入正確的值。
- 如果您使用 InvokeModel，則stream值必須為 false。

OpenAI 回應內文

OpenAI 模型的回應內文符合傳回的聊天完成物件OpenAI。如需回應欄位的詳細資訊，請參閱 OpenAI 文件中的聊天完成物件。

注意

如果您使用 InvokeModel，由<reasoning>標籤包圍的模型推理會先於回應的文字內容。

OpenAI 模型的範例用量

本節提供一些如何使用OpenAI模型的範例。

在嘗試這些範例之前，請檢查您是否符合先決條件：

身分驗證 – 您可以使用您的 AWS 登入資料或 Amazon Bedrock API 金鑰進行身分驗證。

設定您的 AWS 登入資料或產生 Amazon Bedrock API 金鑰來驗證您的請求。
- 若要了解如何設定您的 AWS 登入資料，請參閱使用 AWS 安全登入資料進行程式設計存取。
- 若要了解 Amazon Bedrock API 金鑰以及如何產生金鑰，請參閱產生 Amazon Bedrock API 金鑰以輕鬆驗證 Amazon Bedrock API。
注意
如果您使用OpenAI聊天完成 API，您只能使用 Amazon Bedrock API 金鑰進行身分驗證。
端點 – 尋找與要在 Amazon Bedrock 執行期端點和配額中使用的 AWS 區域對應的端點。 https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-rt如果您使用 AWS SDK，您可能只需要在設定用戶端時指定區域碼，而不是整個端點。您必須使用與範例中所用模型支援的區域相關聯的端點。
模型存取 – 請求存取 OpenAI模型。如需詳細資訊，請參閱新增或移除對 Amazon Bedrock 基礎模型的存取權。
（如果範例使用 SDK) 安裝 SDK – 安裝之後，請設定預設登入資料和預設 AWS 區域。如果您未設定預設登入資料或區域，則必須在相關程式碼範例中明確指定這些登入資料。如需標準化憑證提供者的詳細資訊，請參閱 AWS SDKs和工具標準化憑證提供者。

注意
如果您使用 OpenAI SDK，您只能使用 Amazon Bedrock API 金鑰進行身分驗證，而且您必須明確設定 Amazon Bedrock 端點。

展開您要查看的範例的區段：

若要查看使用OpenAI建立聊天完成 API 的範例，請選擇您偏好方法的索引標籤，然後遵循以下步驟：

選擇您偏好方法的索引標籤，然後遵循下列步驟：

當您使用統一的 Converse API 時，您需要將OpenAI建立聊天完成欄位映射至 Converse 請求內文中的對應欄位。

例如，將下列聊天完成請求內文與其對應的 Converse 請求內文進行比較：

選擇您偏好方法的索引標籤，然後遵循下列步驟：

透過指定護欄 ID、版本，以及是否在模型調用請求的標頭中啟用護欄追蹤，在執行模型調用時套用護欄。

選擇您偏好方法的索引標籤，然後遵循下列步驟：

若要查看在OpenAI聊天完成時使用護欄的範例，請選擇您偏好方法的索引標籤，然後遵循以下步驟：

OpenAI SDK (Python)


import openai
from openai import OpenAIError

# Endpoint for Amazon Bedrock Runtime
bedrock_endpoint = "https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1"

# Model ID
model_id = "openai.gpt-oss-20b-1:0"

# Replace with actual values
bedrock_api_key = "$AWS_BEARER_TOKEN_BEDROCK"
guardrail_id = "GR12345"
guardrail_version = "DRAFT"

client = openai.OpenAI(
    api_key=bedrock_api_key,
    base_url=bedrock_endpoint,
)

try:
    response = client.chat.completions.create(
        model=model_id,
        # Specify guardrail information in the header
        extra_headers={
            "X-Amzn-Bedrock-GuardrailIdentifier": guardrail_id,
            "X-Amzn-Bedrock-GuardrailVersion": guardrail_version,
            "X-Amzn-Bedrock-Trace": "ENABLED",
        },
        # Additional guardrail information can be specified in the body
        extra_body={
            "amazon-bedrock-guardrailConfig": {
                "tagSuffix": "xyz"  # Used for input tagging
            }
        },
        messages=[
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "assistant", 
                "content": "Hello! How can I help you today?"
            },
            {
                "role": "user",
                "content": "What is the weather like today?"
            }
        ]
    )

    request_id = response._request_id
    print(f"Request ID: {request_id}")
    print(response)
    
except OpenAIError as e:
    print(f"An error occurred: {e}")
    if hasattr(e, 'response') and e.response is not None:
        request_id = e.response.headers.get("x-request-id")
        print(f"Request ID: {request_id}")

OpenAI SDK (Java)


import com.openai.client.OpenAIClient;
import com.openai.client.okhttp.OpenAIOkHttpClient;
import com.openai.core.http.HttpResponseFor;
import com.openai.models.chat.completions.ChatCompletion;
import com.openai.models.chat.completions.ChatCompletionCreateParams;

// Endpoint for Amazon Bedrock Runtime
String bedrockEndpoint = "http://bedrock-runtime.us-west-2.amazonaws.com/openai/v1"

// Model ID
String modelId = "openai.gpt-oss-20b-1:0"

// Replace with actual values
String bedrockApiKey = "$AWS_BEARER_TOKEN_BEDROCK"
String guardrailId = "GR12345"
String guardrailVersion = "DRAFT"

OpenAIClient client = OpenAIOkHttpClient.builder()
        .apiKey(bedrockApiKey)
        .baseUrl(bedrockEndpoint)
        .build()

ChatCompletionCreateParams request = ChatCompletionCreateParams.builder()
        .addUserMessage("What is the temperature in Seattle?")
        .model(modelId)
        // Specify additional headers for the guardrail
        .putAdditionalHeader("X-Amzn-Bedrock-GuardrailIdentifier", guardrailId)
        .putAdditionalHeader("X-Amzn-Bedrock-GuardrailVersion", guardrailVersion)
        // Specify additional body parameters for the guardrail
        .putAdditionalBodyProperty(
                "amazon-bedrock-guardrailConfig",
                JsonValue.from(Map.of("tagSuffix", JsonValue.of("xyz"))) // Allows input tagging
        )
        .build();
        
HttpResponseFor<ChatCompletion> rawChatCompletionResponse =
        client.chat().completions().withRawResponse().create(request);

final ChatCompletion chatCompletion = rawChatCompletionResponse.parse();

System.out.println(chatCompletion);

批次推論可讓您使用多個提示以非同步方式執行模型推論。若要使用 OpenAI模型執行批次推論，請執行下列動作：

建立 JSONL 檔案，並填入至少最小數量的 JSON 物件，每個物件都以新行分隔。每個modelInput物件必須符合OpenAI建立聊天完成請求內文的格式。以下顯示包含請求內文的 JSONL 檔案前兩行的範例OpenAI。


{
    "recordId": "RECORD1", 
    "modelInput": {
        "messages": [
            {
                "role": "system", 
                "content": "You are a helpful assistant."
            }, 
            {
                "role": "user", 
                "content": "Can you generate a question with a factual answer?"
            }
        ], 
        "max_completion_tokens": 1000
    }
}
{
    "recordId": "RECORD2", 
    "modelInput": {
        "messages": [
            {
                "role": "system", 
                "content": "You are a helpful assistant."
            }, 
            {
                "role": "user", 
                "content": "What is the weather like today?"
            }
        ], 
        "max_completion_tokens": 1000
    }
}
...

注意

model 欄位是選用的，因為如果您省略批次推論服務，會根據標頭為您插入它。

檢查您的 JSONL 檔案是否符合中所述的批次推論配額格式化和上傳批次推論資料。

將檔案上傳至 Amazon S3 儲存貯體。
使用 S3 儲存貯體的 Amazon Bedrock 控制平面端點傳送 CreateModelInvocationJob 請求，該 S3 儲存貯體來自 inputDataConfig 欄位中指定的步驟，以及 modelId 欄位中指定的OpenAI模型。

如需end-to-end程式碼範例，請參閱批次推論的程式碼範例。將取代為OpenAI模型的適當組態。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

像素大型 (25.02) 參數和推論

Stability AI 模型