搭配 Amazon Bedrock 資源使用佈建輸送量 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

搭配 Amazon Bedrock 資源使用佈建輸送量

購買佈建輸送量後,您可以搭配下列功能使用,以增加輸送量:

  • 模型推論 – 您可以在 Amazon Bedrock 主控台遊樂場中測試佈建輸送量。當您準備好部署佈建輸送量時,請設定應用程式來叫用佈建模型。選取與您所選方法對應的索引標籤,然後遵循下列步驟:

    Console
    在 Amazon Bedrock 主控台遊樂場中使用佈建輸送量
    1. AWS Management Console 使用IAM具有 Amazon Bedrock 許可 的角色登入 ,並在 開啟 Amazon Bedrock 主控台https://console.aws.amazon.com/bedrock/

    2. 從左側導覽窗格中,根據使用案例,選取遊戲區 下的聊天文字影像

    3. 選擇 選擇模型

    4. 1 中。類別欄,選取提供者或自訂模型類別。然後,在 2 中。模型欄,選取與佈建輸送量相關聯的模型。

    5. 3 中。輸送量欄,選取佈建輸送量。

    6. 選擇套用

    若要了解如何使用 Amazon Bedrock 遊樂場,請參閱 使用遊樂場在視覺化介面中產生回應

    API

    若要使用佈建輸送量執行推論,請傳送 InvokeModel、、InvokeModelWithResponseStreamConverse ConverseStream 請求 (請參閱 連結以取得請求和回應格式和欄位詳細資訊) 與 Amazon Bedrock 執行期端點 。指定佈建的模型ARN作為 modelId 參數。若要查看不同模型的要求內文,請參閱 基礎模型的推論請求參數和回應欄位

    請參閱程式碼範例

  • 將佈建輸送量與客服人員別名建立關聯 – 您可以在建立更新客服人員別名時建立佈建輸送量的關聯。在 Amazon Bedrock 主控台中,您可以在設定別名或編輯別名時選擇佈建輸送量。在 Amazon Bedrock 中API,當您傳送 CreateAgentAliasUpdateAgentAlias; 請求routingConfiguration時,您可以在 provisionedThroughput中指定 。