选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

更新使用自动扩缩的端点

聚焦模式
更新使用自动扩缩的端点 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

更新端点时,应用程序自动扩缩会检查该端点上是否有任何模型是自动扩缩的目标。如果更新会改变作为自动扩缩目标的任何模型的实例类型,则更新失败。

在中 AWS Management Console,您会看到一条警告,提示您必须先从 auto Scaling 中取消注册模型,然后才能对其进行更新。如果您试图通过调用UpdateEndpoint API 来更新终端节点,则调用将失败。在更新终端节点之前,请删除为其配置的所有扩展策略,并通过调用 App DeregisterScalableTargetlication Auto Scaling API 操作将该变体取消注册为可扩展目标。更新端点后,您可以将更新后的变体注册为可扩展目标,并附加扩展策略。

有一个例外。如果您更改配置为自动缩放的变体的模型,Amazon A SageMaker I auto scaling 将允许更新。这是因为更改模型对性能的影响通常不足以改变扩展行为。如果您确实要为配置为自动扩缩的变体更新模型,请确保对模型的更改不会对性能和扩展行为造成重大影响。

更新应用了 auto Scaling 的 SageMaker AI 终端节点时,请完成以下步骤:

更新已应用自动扩缩功能的端点
  1. 通过调DeregisterScalableTarget用取消将终端节点注册为可扩展目标。

  2. 由于在更新操作过程中自动扩缩会被阻止(或者如果您在上一步中关闭了自动扩缩),您可能需要采取额外的预防措施,在更新期间增加端点的实例数量。为此,请通过调用 UpdateEndpointWeightsAndCapacities,为该终端节点上托管的生产变体增加实例数量。

  3. 重复调用 DescribeEndpoint,直到响应的 EndpointStatus 字段的值为 InService

  4. 调用 DescribeEndpointConfig 来获取当前终端节点配置值。

  5. 通过调用 CreateEndpointConfig 创建新的终端节点配置。对于要保留现有实例计数或权重的生产变体,请使用在前一步中调用 DescribeEndpointConfig 所得到的响应中的相同变体名称。对于所有其他值,请使用在上一步骤中调用 DescribeEndpointConfig 时作为响应获取的值。

  6. 通过调用 UpdateEndpoint 更新终端节点。指定在上一步中创建的终端节点配置作为 EndpointConfig 字段。如果要保留变体属性(如实例计数或权重),请将 RetainAllVariantProperties 参数的值设置为 True。这会指定具有相同名称的生产变体将使用从调用 DescribeEndpoint 得到的响应中的最新 DesiredInstanceCount 进行更新,而不考虑新 EndpointConfigInitialInstanceCount 字段的值。

  7. (可选)通过调用RegisterScalableTargetPutScalingPolicy来重新激活 auto Scaling。

注意

只有在使用以下更改更新终端节点时,才需要步骤 1 和 7:

  • 更改已配置自动扩缩的生产变体的实例类型

  • 删除已配置自动扩缩功能的生产变体。

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。