モデルの追加または削除 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

モデルの追加または削除

追加のモデルをマルチモデルエンドポイントにデプロイし、そのエンドポイントからすぐにそれらモデルを呼び出すことができます。新しいモデルを追加するときは、エンドポイントを更新または停止する必要がないため、新しいモデルごとに個別のエンドポイントを作成して実行するコストを回避できます。

SageMaker は、インスタンスがメモリ容量に達し、より多くのモデルをコンテナにダウンロードする必要があると、コンテナから未使用のモデルをアンロードします。SageMaker は、ボリュームが容量に達し、新しいモデルをダウンロードする必要があると、インスタンスストレージボリュームから未使用のモデルアーティファクトも削除します。新しく追加されたモデルの最初の呼び出し時間は長くなります。これは、エンドポイントがモデルを S3 から、エンドポイントをホストするインスタンスのコンテナのメモリにダウンロードするのに時間がかかるためです。

エンドポイントがすでに実行されている状態で、モデルアーティファクトの新しいセットを、モデルを保存する Amazon S3 の場所にコピーします。

# Add an AdditionalModel to the endpoint and exercise it aws s3 cp AdditionalModel.tar.gz s3://my-bucket/path/to/artifacts/
重要

モデルを更新するには、新しいモデルを追加するときと同様に進めます。新しい一意の名前を使用します。Amazon S3 のモデルアーティファクトを上書きしないでください。これは、モデルの古いバージョンが引き続きコンテナにロードされるか、エンドポイント上のインスタンスのストレージボリュームにロードされる可能性があるためです。新しいモデルを呼び出すと、モデルの古いバージョンが呼び出されることがあります。

クライアントアプリケーションは、追加のターゲットモデルが S3 に保存されるとすぐに、そのモデルに予測をリクエストできます。

response = runtime_sm_client.invoke_endpoint( EndpointName='<ENDPOINT_NAME>', ContentType='text/csv', TargetModel='AdditionalModel.tar.gz', Body=body)

マルチモデルエンドポイントからモデルを削除するには、クライアントからのモデルの呼び出しを停止し、モデルアーティファクトが保存されている S3 の場所からそのモデルを削除します。