翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Canvas では、モデルをエンドポイントにデプロイして予測を行うことができます。SageMaker AI は、選択したコンピューティングインスタンスを使用してエンドポイントでモデルをホストするための ML インフラストラクチャを提供します。次に、エンドポイントを呼び出し (予測リクエストを送信)、モデルからリアルタイム予測を取得できます。この機能を使用すると、本番環境でモデルを使用して受信リクエストに応答し、モデルを既存のアプリケーションやワークフローと統合できます。
開始するには、デプロイするモデルが必要です。構築したカスタムモデルバージョン、Amazon SageMaker JumpStart 基盤モデル、ファインチューニングされた JumpStart 基盤モデルをデプロイできます。Canvas でのモデル構築の詳細については、「カスタムモデルの仕組み」を参照してください。Canvas での JumpStart 基盤モデルの詳細については、「SageMaker Canvas の生成 AI 基盤モデル」を参照してください。
次の「権限の管理」セクションを確認してから、「モデルをデプロイする」セクションで新しいデプロイの作成を開始します。
権限の管理
デフォルトでは、SageMaker AI ホスティングエンドポイントにモデルをデプロイするアクセス許可があります。SageMaker AI は、Canvas アプリケーションをホストする SageMaker AI ドメインの IAM 実行ロールにアタッチされている AmazonSageMakerCanvasFullAccess ポリシーを通じて、すべての新規および既存の Canvas ユーザープロファイルにこれらのアクセス許可を付与します。 AWS SageMaker
Canvas 管理者が新しいドメインまたはユーザープロファイルを設定している場合、ドメインを設定し、「」の前提条件の手順に従ってAmazon SageMaker Canvas を設定するための前提条件、SageMaker AI は Canvas モデルの直接デプロイを有効にするオプションを使用してモデルのデプロイ許可を有効にします。これはデフォルトで有効になっています。
Canvas 管理者はモデルのデプロイ権限をユーザープロファイルレベルでも管理できます。例えば、管理者がドメインの設定時にすべてのユーザープロファイルにモデルのデプロイ権限を付与しない場合は、ドメインの作成後に特定のユーザーに権限を付与できます。
特定のユーザープロファイルのモデルのデプロイ権限を変更するには、次の手順に従います。
-
https://console.aws.amazon.com/sagemaker/
://www.com」で SageMaker AI コンソールを開きます。 -
左のナビゲーションペインで、[管理設定] を選択します。
-
[管理設定] で、[ドメイン] を選択します。
-
ドメインのリストで、ユーザープロファイルのドメインを選択します。
-
[ドメインの詳細] ページで、[ユーザープロファイル] タブを選択します。
-
[ユーザープロファイル] を選択します。
-
ユーザープロファイルページで、[アプリケーション設定] タブを選択します。
-
[Canvas] セクションで、[編集] を選択します。
-
[ML Ops 設定] セクションで、[Canvas モデルの直接デプロイを有効にする] トグルをオンにして、デプロイ権限を有効にします。
-
[送信] を選択して、ドメインの設定の変更を保存します。
これでユーザープロファイルにモデルのデプロイ権限が付与されます。
ドメインまたはユーザープロファイルに権限を付与したら、権限の変更を適用するために、ユーザーが Canvas アプリケーションからログアウトし、再度ログインすることを確認してください。
モデルをデプロイする
モデルのデプロイを開始するには、Canvas で新しいデプロイを作成し、モデルのホストに使用するコンピューティングインスタンスのタイプや数など、ML インフラストラクチャとともにデプロイするモデルバージョンを指定します。
Canvas は、モデルタイプに基づいてデフォルトのタイプとインスタンス数を提案します。または、Amazon SageMaker の料金ページでさまざまな Amazon SageMaker
JumpStart 基盤モデルをデプロイする際には、デプロイ時間の長さを指定するオプションもあります。モデルはエンドポイントに無期限にデプロイできます (つまり、エンドポイントはデプロイを削除するまでアクティブになります)。または、短期間のみエンドポイントが必要で、コストを削減したい場合は、指定された期間、モデルをエンドポイントにデプロイできます。その後、SageMaker AI はエンドポイントをシャットダウンします。
注記
指定の期間だけモデルをデプロイする場合は、エンドポイントの存続期間中、Canvas アプリケーションにログインしたままにします。アプリケーションからログアウトするか、アプリケーションを削除した場合、Canvas は指定された時間にエンドポイントをシャットダウンできなくなります。
モデルが SageMaker AI ホスティングのリアルタイム推論エンドポイントにデプロイされたら、エンドポイントを呼び出すことで予測を開始できます。
Canvas アプリケーションからモデルをデプロイする方法はいくつかあります。モデルのデプロイオプションには、次のいずれかの方法を使用してアクセスできます。
-
Canvas アプリケーションの [マイモデル] ページで、デプロイするモデルを選択します。次に、モデルの [バージョン] ページから、モデルバージョンの横にある [その他のオプション] アイコン (
) を選択し、 [デプロイ] を選択します。
-
モデルバージョンの詳細ページにある [分析] タブで、[デプロイ] オプションを選択します。
-
モデルバージョンの詳細ページにある [予測] タブで、ページの上部にある [その他のオプション] アイコン (
) を選択し、 [デプロイ] を選択します。
-
Canvas アプリケーションの [ML オペレーション] ページで、[デプロイ] タブを選択し、[デプロイの作成] を選択します。
-
JumpStart 基盤モデルおよびファインチューニングされた基盤モデルの場合は、Canvas アプリケーションの [Ready-to-use モデル] ページに移動します。[コンテンツの生成、抽出、要約] を選択します。次に、デプロイする JumpStart 基盤モデルまたはファインチューニングされた基盤モデルを見つけます。モデルを選択し、モデルのチャットページで [デプロイ] ボタンを選択します。
これらのどの方法によっても、[モデルをデプロイ] サイドパネルが開かれます。ここではモデルのデプロイ設定を指定します。このパネルからモデルをデプロイするには、以下を実行します。
-
(オプション) [ML オペレーション] ページからデプロイを作成する場合は、[モデルとバージョンを選択する] オプションがあります。ドロップダウンメニューを使用して、デプロイするモデルとモデルのバージョンを選択します。
-
[デプロイ名] フィールドに名前を入力します。
-
(JumpStart 基盤モデルとファインチューニングされた基盤モデルのみ) [デプロイの長さ] を選択します。[無制限] を選択すると、エンドポイントはシャットダウンされるまでアクティブのままになります。または、[長さを指定] を選択してから、エンドポイントをアクティブのままにする期間を入力します。
-
インスタンスタイプの場合、SageMaker AI はモデルに適したデフォルトのインスタンスタイプと数を検出します。ただし、モデルのホストに使用するインスタンスタイプは変更できます。
注記
AWS アカウントで選択したインスタンスタイプのインスタンスクォータが不足している場合は、クォータの引き上げをリクエストできます。デフォルトのクォータと引き上げをリクエストする方法の詳細については、「 AWS 全般のリファレンスガイド」のAmazon SageMaker AI エンドポイントとクォータ」を参照してください。
-
[インスタンス数] では、エンドポイントに使用されるアクティブなインスタンスの数を設定できます。SageMaker AI はモデルに適したデフォルトの数値を検出しますが、この数値は変更できます。
-
モデルをデプロイする準備ができたら、[デプロイ] を選択します。
これで、モデルがエンドポイントにデプロイされます。