部署自定义模型
您可以使用 Amazon Bedrock 控制台、AWS Command Line Interface 或 AWS SDK 部署自定义模型。有关使用部署进行推理的信息,请参阅使用部署进行按需型推理。
部署自定义模型(控制台)
您可以从自定义模型页面中部署自定义模型,如下所示。您也可以从按需自定义模型页面中部署具有相同字段的模型。要找到此页面,请在导航窗格的推理和评估中选择按需自定义模型。
部署自定义模型
-
使用具有 Amazon Bedrock 权限的 IAM 角色登录 AWS Management Console,然后通过 https://console.aws.amazon.com/nova/
打开 Amazon Bedrock 控制台。 -
在左侧导航窗格的基础模型下,选择自定义模型。
-
在模型选项卡中,选择想要部署的模型对应的单选按钮。
-
选择设置推理,然后选择按需部署。
-
在部署详细信息页面上,提供以下信息:
-
部署名称(必填):输入部署的唯一名称。
-
描述(可选):为部署描述输入描述。
-
标签(可选):为成本分配和资源管理添加标签。
-
-
选择创建。当状态显示
Completed
时,表示自定义模型已做好按需推理的准备。有关使用自定义模型的更多信息,请参阅使用部署进行按需型推理。
部署自定义模型 (AWS Command Line Interface)
要使用 AWS Command Line Interface 部署自定义模型进行按需型推理,请使用带有自定义模型的 Amazon 资源名称 (ARN) 的 create-custom-model-deployment
命令。此命令使用 CreateCustomModelDeployment API 操作。它返回部署的 ARN,您可以在提出推理请求时将其用作 modelId
。有关使用部署进行推理的信息,请参阅使用部署进行按需型推理。
aws bedrock create-custom-model-deployment \ --model-deployment-name "
Unique name
" \ --model-arn "Custom Model ARN
" \ --description "Deployment description
" \ --tags '[ { "key": "Environment", "value": "Production" }, { "key": "Team", "value": "ML-Engineering" }, { "key": "Project", "value": "CustomerSupport" } ]' \ --client-request-token "unique-deployment-token
" \ --regionregion
部署自定义模型 (AWS SDK)
要部署自定义模型进行按需型推理,请使用带有自定义模型的 Amazon 资源名称 (ARN) 的 CreateCustomModelDeployment API 操作。响应返回部署的 ARN,您可以在提出推理请求时将其用作 modelId
。有关使用部署进行推理的信息,请参阅使用部署进行按需型推理。
以下代码演示了如何使用 SDK for Python (Boto3) 部署自定义模型。
def create_custom_model_deployment(bedrock_client): """Create a custom model deployment Args: bedrock_client: A boto3 Bedrock client for making API calls Returns: str: The ARN of the created custom model deployment Raises: Exception: If there is an error creating the deployment """ try: response = bedrock_client.create_custom_model_deployment( modelDeploymentName="
Unique deployment name
", modelArn="Custom Model ARN
", description="Deployment description
", tags=[ {'key': 'Environment', 'value': 'Production'}, {'key': 'Team', 'value': 'ML-Engineering'}, {'key': 'Project', 'value': 'CustomerSupport'} ], clientRequestToken=f"deployment-{uuid.uuid4()}" ) deployment_arn = response['customModelDeploymentArn'] print(f"Deployment created: {deployment_arn}") return deployment_arn except Exception as e: print(f"Error creating deployment: {str(e)}") raise