翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Studio を使用して JumpStart からモデルをデプロイする Amazon SageMaker
次の手順は、Amazon SageMaker Studio を使用して JumpStart からモデルをデプロイする方法を示しています。
前提条件
Amazon SageMaker HyperPod クラスターで推論機能をセットアップしていることを確認します。詳細については、「モデルデプロイ用の HyperPod クラスターのセットアップ」を参照してください。
HyperPod デプロイを作成する
-
Amazon SageMaker Studio で、左側のナビゲーションペインから JumpStart ランディングページを開きます。
-
すべてのパブリックモデルで、デプロイするモデルを選択します。
注記
ゲートモデルを選択した場合は、エンドユーザーライセンス契約 (EULA) に同意する必要があります。
-
SageMaker HyperPod を選択します。
-
デプロイ設定で、JumpStart はデプロイにインスタンスを推奨します。必要に応じて、これらの設定を変更できます。
-
インスタンスタイプを変更する場合は、選択した HyperPod クラスターと互換性があることを確認してください。互換性のあるインスタンスがない場合は、新しい HyperPod クラスターを選択するか、管理者に連絡して互換性のあるインスタンスをクラスターに追加する必要があります。
-
モデルのデプロイに優先順位を付けるには、タスクガバナンスアドオンをインストールし、コンピューティング割り当てを作成し、クラスターポリシーのタスクランキングを設定します。これが完了すると、クラスター上の他のデプロイやタスクのプリエンプションに使用できるモデルデプロイの優先度を選択するオプションが表示されます。
-
管理者がアクセスを許可した名前空間を入力します。正確な名前空間を取得するには、管理者に直接連絡する必要がある場合があります。有効な名前空間が提供されたら、デプロイボタンを有効にしてモデルをデプロイする必要があります。
-
-
デプロイを選択し、エンドポイントが作成されるまで待ちます。
-
エンドポイントを作成したら、推論のテストを選択します。
HyperPod デプロイを編集する
-
Amazon SageMaker Studio で、左側のナビゲーションペインからコンピューティングを選択し、HyperPod クラスターを選択します。
-
デプロイで、変更する HyperPod クラスターデプロイを選択します。
-
縦の省略記号アイコン (⋮) から編集を選択します。
-
デプロイ設定では、自動スケーリングを有効または無効にし、最大レプリカの数を変更できます。
-
[保存] を選択します。
-
ステータスは更新に変わります。サービス中に戻ると、変更が完了し、確認メッセージが表示されます。
HyperPod デプロイを削除する
-
Amazon SageMaker Studio で、左側のナビゲーションペインからコンピューティングを選択し、HyperPod クラスターを選択します。
-
デプロイで、変更する HyperPod クラスターデプロイを選択します。
-
縦の省略記号アイコン (⋮) から、削除を選択します。
-
HyperPod デプロイの削除ウィンドウで、チェックボックスをオンにします。
-
[削除] を選択します。
-
ステータスは 削除に変わります。HyperPod デプロイが削除されると、それを確認するメッセージが表示されます。