选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

调用无服务器端点

聚焦模式
调用无服务器端点 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

要使用无服务器端点执行推理,必须向端点发送 HTTP 请求。您可以使用 InvokeEndpointAPI 或 AWS CLI,它们会POST请求调用您的终端节点。无服务器调用的最大请求和响应负载大小为 4 MB。对于无服务器端点:

  • 模型必须下载,服务器必须在 3 分钟内成功响应 /ping

  • 容器响应 /invocations 推理请求的超时为 1 分钟。

调用端点

以下示例使用适用于 Python 的AWS 软件开发工具包 (Boto3) 来调用 API。InvokeEndpoint请注意,与本指南中的其他 API 调用不同InvokeEndpoint,您必须使用 SageMaker 运行时运行时作为客户端。指定以下值:

  • 对于 endpoint_name,使用要调用的服务中无服务器端点的名称。

  • 对于 content_type,在请求正文中指定输入数据的 MIME 类型(例如 application/json)。

  • 对于 payload,使用您的请求负载进行推理。您的负载应该采用字节或类似文件的对象形式。

runtime = boto3.client("sagemaker-runtime") endpoint_name = "<your-endpoint-name>" content_type = "<request-mime-type>" payload = <your-request-body> response = runtime.invoke_endpoint( EndpointName=endpoint_name, ContentType=content_type, Body=payload )
隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。