部署自定义模型 - Amazon Nova

部署自定义模型

您可以使用 Amazon Bedrock 控制台、AWS Command Line Interface 或 AWS SDK 部署自定义模型。有关使用部署进行推理的信息,请参阅使用部署进行按需型推理

部署自定义模型(控制台)

您可以从自定义模型页面中部署自定义模型,如下所示。您也可以从按需自定义模型页面中部署具有相同字段的模型。要找到此页面,请在导航窗格的推理和评估中选择按需自定义模型

部署自定义模型
  1. 使用具有 Amazon Bedrock 权限的 IAM 角色登录 AWS Management Console,然后通过 https://console.aws.amazon.com/nova/ 打开 Amazon Bedrock 控制台。

  2. 在左侧导航窗格的基础模型下,选择自定义模型

  3. 模型选项卡中,选择想要部署的模型对应的单选按钮。

  4. 选择设置推理,然后选择按需部署

  5. 部署详细信息页面上,提供以下信息:

    • 部署名称(必填):输入部署的唯一名称。

    • 描述(可选):为部署描述输入描述。

    • 标签(可选):为成本分配和资源管理添加标签。

  6. 选择创建。当状态显示 Completed 时,表示自定义模型已做好按需推理的准备。有关使用自定义模型的更多信息,请参阅使用部署进行按需型推理

部署自定义模型 (AWS Command Line Interface)

要使用 AWS Command Line Interface 部署自定义模型进行按需型推理,请使用带有自定义模型的 Amazon 资源名称 (ARN) 的 create-custom-model-deployment 命令。此命令使用 CreateCustomModelDeployment API 操作。它返回部署的 ARN,您可以在提出推理请求时将其用作 modelId。有关使用部署进行推理的信息,请参阅使用部署进行按需型推理

aws bedrock create-custom-model-deployment \ --model-deployment-name "Unique name" \ --model-arn "Custom Model ARN" \ --description "Deployment description" \ --tags '[ { "key": "Environment", "value": "Production" }, { "key": "Team", "value": "ML-Engineering" }, { "key": "Project", "value": "CustomerSupport" } ]' \ --client-request-token "unique-deployment-token" \ --region region

部署自定义模型 (AWS SDK)

要部署自定义模型进行按需型推理,请使用带有自定义模型的 Amazon 资源名称 (ARN) 的 CreateCustomModelDeployment API 操作。响应返回部署的 ARN,您可以在提出推理请求时将其用作 modelId。有关使用部署进行推理的信息,请参阅使用部署进行按需型推理

以下代码演示了如何使用 SDK for Python (Boto3) 部署自定义模型。

def create_custom_model_deployment(bedrock_client): """Create a custom model deployment Args: bedrock_client: A boto3 Bedrock client for making API calls Returns: str: The ARN of the created custom model deployment Raises: Exception: If there is an error creating the deployment """ try: response = bedrock_client.create_custom_model_deployment( modelDeploymentName="Unique deployment name", modelArn="Custom Model ARN", description="Deployment description", tags=[ {'key': 'Environment', 'value': 'Production'}, {'key': 'Team', 'value': 'ML-Engineering'}, {'key': 'Project', 'value': 'CustomerSupport'} ], clientRequestToken=f"deployment-{uuid.uuid4()}" ) deployment_arn = response['customModelDeploymentArn'] print(f"Deployment created: {deployment_arn}") return deployment_arn except Exception as e: print(f"Error creating deployment: {str(e)}") raise