カスタムモデルをデプロイする
Amazon Bedrock コンソール、AWS Command Line Interface、または AWS SDK を使用してカスタムモデルをデプロイできます。推論にデプロイを使用する方法については、「オンデマンド推論にデプロイを使用する」を参照してください。
カスタムモデルのデプロイ (コンソール)
カスタムモデルは、[カスタムモデル] ページから次のようにデプロイします。[オンデマンドのカスタムモデル] ページからでも、同じフィールドを使用してモデルをデプロイできます。このページにアクセスするには、ナビゲーションペインの [推論と評価] で、[オンデマンドのカスタムモデル] を選択します。
カスタムモデルをデプロイするには
-
Amazon Bedrock アクセス許可を持つ IAM ロールを使用して AWS Management Consoleにサインインし、Amazon Bedrock コンソール (https://console.aws.amazon.com/nova/
) を開きます。 -
左側のナビゲーションペインの [基盤モデル] で [カスタムモデル] を選択します。
-
[モデル] タブで、デプロイするモデルのラジオボタンを選択します。
-
[推論を設定] を選択し、[オンデマンドのデプロイ] を選択します。
-
[デプロイの詳細] で、次の情報を入力します。
-
デプロイ名 (必須) – デプロイの一意の名前を入力します。
-
説明 (オプション) – デプロイの説明を入力します。
-
タグ (オプション) – コスト配分とリソース管理用のタグを追加します。
-
-
[作成] を選択します。カスタムモデルでオンデマンド推論の準備が整うと、ステータスが「
Completed
」と表示されます。カスタムモデル使用の詳細については、「オンデマンド推論にデプロイを使用する」を参照してください。
カスタムモデルをデプロイする (AWS Command Line Interface)
AWS Command Line Interface を使用してオンデマンド推論用のカスタムモデルをデプロイするには、カスタムモデルの Amazon リソースネーム (ARN) で create-custom-model-deployment
コマンドを使用します。このコマンドは CreateCustomModelDeployment API オペレーションを使用します。推論リクエストを行うときに modelId
として使用できるデプロイの ARN が返ってきます。推論にデプロイを使用する方法については、「オンデマンド推論にデプロイを使用する」を参照してください。
aws bedrock create-custom-model-deployment \ --model-deployment-name "
Unique name
" \ --model-arn "Custom Model ARN
" \ --description "Deployment description
" \ --tags '[ { "key": "Environment", "value": "Production" }, { "key": "Team", "value": "ML-Engineering" }, { "key": "Project", "value": "CustomerSupport" } ]' \ --client-request-token "unique-deployment-token
" \ --regionregion
カスタムモデルをデプロイする (AWS SDK)
オンデマンド推論用のカスタムモデルをデプロイするには、カスタムモデルの Amazon リソースネーム (ARN) で CreateCustomModelDeployment API オペレーションを使用します。レスポンスとして、推論リクエストを行うときに modelId
として使用できるデプロイの ARN が返ってきます。推論にデプロイを使用する方法については、「オンデマンド推論にデプロイを使用する」を参照してください。
次のコードは、SDK for Python (Boto3) を使用してカスタムモデルをデプロイする方法を示しています。
def create_custom_model_deployment(bedrock_client): """Create a custom model deployment Args: bedrock_client: A boto3 Bedrock client for making API calls Returns: str: The ARN of the created custom model deployment Raises: Exception: If there is an error creating the deployment """ try: response = bedrock_client.create_custom_model_deployment( modelDeploymentName="
Unique deployment name
", modelArn="Custom Model ARN
", description="Deployment description
", tags=[ {'key': 'Environment', 'value': 'Production'}, {'key': 'Team', 'value': 'ML-Engineering'}, {'key': 'Project', 'value': 'CustomerSupport'} ], clientRequestToken=f"deployment-{uuid.uuid4()}" ) deployment_arn = response['customModelDeploymentArn'] print(f"Deployment created: {deployment_arn}") return deployment_arn except Exception as e: print(f"Error creating deployment: {str(e)}") raise