选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

可用选项

聚焦模式
可用选项 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

下表显示了您可以用来自定义笔记本作业的所有可用选项,无论是在 Studio、本地 Jupyter 环境中运行笔记本作业,还是使用 Pyth SageMaker on SDK。该表包括自定义选项的类型、描述、有关如何使用该选项的其他指南、Studio 中该选项的字段名称(如果可用)以及 SageMaker Python SDK 中笔记本作业步骤的参数名称(如果有)。

对于某些选项,您还可以预设自定义默认值,这样就不必在每次设置笔记本作业时都指定这些值。对于 Studio,这些选项是角色输入文件夹输出文件夹KMS 密钥 ID,并在下表中指定。如果您为这些选项预设了自定义默认值,那么在创建笔记本作业时,这些字段就会预先填入创建作业表单中。有关如何在 Studio 和本地 Jupyter 环境中创建自定义默认设置的详细信息,请参阅 为本地笔记本设置默认选项

SageMaker AI SDK 还为您提供了设置智能默认值的选项,这样您就不必在创建时指定这些参数NotebookJobStep。这些参数分别为 roles3_root_uris3_kms_keyvolume_kms_keysubnetssecurity_group_ids,并在下表中指定。有关如何设置智能默认值的信息,请参阅 设置默认选项

自定义选项 描述 Studio 特定指南 本地 Jupyter 环境指南 SageMaker Python 开发工具包指南
作业名称 您的作业名称应显示在笔记本作业控制面板中。 字段 Job name 与 Studio 相同。 参数 notebook_job_name。默认值为 None
图像 用于在所选计算类型上以非交互方式运行笔记本的容器映像。 字段 Image。此字段默认为笔记本的当前映像。如果需要,将此字段从默认值更改为自定义值。如果 Studio 无法推断出此值,则表单会显示一个验证错误,要求您指定该值。此图片可以是自定义图片、bring-your-own 图片或可用的 Amazon SageMaker AI 图片。有关笔记本调度程序支持的可用 SageMaker AI 映像的列表,请参阅亚马逊 SageMaker AI 图像可用于 Studio Classic 字段 Image。此字段需要 Docker 映像的 ECR URI,该映像可以在所选计算类型上运行所提供的笔记本。默认情况下,调度器扩展使用预先构建的 SageMaker AI Docker 镜像(基于 Python 2.0)。这是来自 boto3 和 Python 3 内核 DockerHub 的官方 Python 3.8 图片。 AWS CLI您还可以提供符合笔记本自定义映像规范的任何 ECR URI。有关详细信息,请参阅自定义 SageMaker AI 图像规格。此映像应包含笔记本运行所需的所有内核和库。 必填项。参数 image_uri。ECR 上 Docker 映像的 URI 位置。您可以使用特定的 SageMaker 分发映像或基于这些映像的自定义映像,也可以使用预先安装的 notebook 作业依赖项满足其他要求的自己的映像。有关详细信息,请参阅 SageMaker AI Python SDK 笔记本作业的图像限制
实例类型 用于运行笔记本作业的 EC2 实例类型。notebook 作业使用 T SageMaker raining Job 作为计算层,因此指定的实例类型应为 Tra SageMaker ining 支持的实例类型。 字段 Compute type。默认值为 ml.m5.large 与 Studio 相同。 参数 instance_type。默认值为 ml.m5.large
内核 用于运行笔记本作业的 Jupyter 内核。 字段 Kernel。此字段默认为笔记本的当前内核。如果需要,将此字段从默认值更改为自定义值。如果 Studio 无法推断出此值,则表单会显示一个验证错误,要求您指定该值。 字段 Kernel。此内核应出现在映像中并遵循 Jupyter 内核规范。该字段默认为在基本 Python 2.0 SageMaker 人工智能镜像中找到的 Python3 内核。如果需要,请将此字段更改为自定义值。 必填项。参数 kernel_name。此内核应出现在映像中并遵循 Jupyter 内核规范。要查看映像的内核标识符,请参阅 (LINK)。
SageMaker 人工智能会话 委托 SageMaker AI 服务调用的底层 SageMaker AI 会话。 不适用 不适用 参数 sagemaker_session。如果未指定,则使用默认配置链创建一个。
角色 ARN 用于笔记本作业的角色的 Amazon 资源名称 (ARN)。 字段 Role ARN。此字段默认为 Studio 执行角色。如果需要,请将此字段更改为自定义值。
注意

如果 Studio 无法推断出此值,则角色 ARN 字段为空。在这种情况下,请插入要使用的 ARN。

字段 Role ARN。此字段默认为任何前缀为 SagemakerJupyterScheduler 的角色。如果您有多个带有该前缀的角色,则扩展程序会选择其中一个。如果需要,请将此字段更改为自定义值。对于此字段,您可以设置自己的用户默认值,只要您创建新的作业定义,就会预填充该默认值。有关详细信息,请参阅为本地笔记本设置默认选项 参数 role。如果软件开发工具包在 SageMaker 笔记本或 SageMaker Studio 笔记本中运行,则默认为 A SageMaker I 默认 IAM 角色。否则会抛出一个 ValueError。允许智能默认设置。
输入笔记本 您计划运行的笔记本的名称。 必填项。字段 Input file 与 Studio 相同。 必填参数 input_notebook
输入文件夹 包含您的输入的文件夹。作业输入(包括输入笔记本和任何可选的启动或初始化脚本)都放在此文件夹中。 字段 Input folder。如果您不提供文件夹,则调度器会为您的输入创建一个默认 Amazon S3 存储桶。 与 Studio 相同。对于此字段,您可以设置自己的用户默认值,只要您创建新的作业定义,就会预填充该默认值。有关详细信息,请参阅为本地笔记本设置默认选项 不适用。输入文件夹放置在参数 s3_root_uri 指定的位置内。
输出文件夹 包含您的输出的文件夹。作业输出(包括输出笔记本和日志)都放在此文件夹中。 字段 Output folder。如果您未指定文件夹,则调度器会为您的输出创建一个默认 Amazon S3 存储桶。 与 Studio 相同。对于此字段,您可以设置自己的用户默认值,只要您创建新的作业定义,就会预填充该默认值。有关详细信息,请参阅为本地笔记本设置默认选项 不适用。输出文件夹放在参数 s3_root_uri 指定的位置内。
参数 一个变量和数值字典,用于向笔记本作业传递变量和数值。 字段 Parameters。您需要对笔记本进行参数化,以便接受参数。 与 Studio 相同。 参数 parameters。您需要对笔记本进行参数化,以便接受参数。
附加(文件或文件夹)依赖项 笔记本作业上传到 s3 暂存文件夹的文件或文件夹依赖关系列表。 不支持。 不支持。 参数 additional_dependencies。笔记本作业会将这些依赖关系上传到 S3 暂存文件夹,以便在执行过程中使用。
S3 根 URI 包含您的输入的文件夹。作业输入(包括输入笔记本和任何可选的启动或初始化脚本)都放在此文件夹中。 不适用。使用 Input FolderOutput folder 与 Studio 相同。 参数 s3_root_uri。默认为默认 S3 存储桶。允许智能默认设置。
环境变量 您要覆盖的任何现有环境变量,或者要在笔记本中引入和使用的新环境变量。 字段 Environment variables 与 Studio 相同。 参数 environment_variables。默认值为 None
标签 作业所附的标记列表。 不适用 不适用 参数 tags。默认值为 None。您的标记控制着 Studio UI 捕捉和显示管道创建的作业的方式。有关详细信息,请参阅在 Studio UI 面板上查看笔记本作业
启动脚本 笔记本启动菜单中预加载的脚本,您可以选择在运行笔记本之前运行该脚本。 字段 Start-up script。选择启动时在映像上运行的生命周期配置 (LCC) 脚本。
注意

启动脚本在 Studio 环境之外的 Shell 中运行。因此,此脚本不能依赖于 Studio 本地存储、环境变量或应用程序元数据(/opt/ml/metadata 中)。此外,如果您使用启动脚本和初始化脚本,则启动脚本将首先运行。

不支持。 不支持。
初始化脚本 指向可在笔记本启动时运行的本地脚本的路径。 字段 Initialization script。输入本地脚本或生命周期配置 (LCC) 脚本所在的 EFS 文件路径。如果您使用启动脚本和初始化脚本,则启动脚本将首先运行。
注意

初始化脚本源自与笔记本作业相同的 Shell。之前描述的启动脚本则不是这种情况。此外,如果您使用启动脚本和初始化脚本,则启动脚本将首先运行。

字段 Initialization script。输入本地脚本或生命周期配置 (LCC) 脚本所在的本地文件路径。 参数 initialization_script。默认值为 None
最大重试次数 Studio 尝试重新运行失败作业的次数。 字段 Max retry attempts。默认值为 1。 与 Studio 相同。 参数 max_retry_attempts。默认值为 1。
最大运行时间(以秒为单位) 笔记本作业在停止之前可以运行的最长时间(以秒为单位)。如果您同时配置了最大运行时间最大重试次数,则每次重试都会应用该运行时间。如果在这段时间内未完成作业,则其状态将设置为 Failed 字段 Max run time (in seconds)。默认值为 172800 seconds (2 days) 与 Studio 相同。 参数 max_runtime_in_seconds。默认值为 172800 seconds (2 days)
重试策略 重试策略列表,用于管理失败情况下的操作。 不支持。 不支持。 参数 retry_policies。默认值为 None
添加 StepStepCollection 依赖项 作业所依赖的 StepStepCollection 名称或实例的列表。 不支持。 不支持。 参数 depends_on。默认值为 None。用它来定义管道图中各步骤之间的显式依赖关系。
卷大小 训练期间用于存储输入和输出数据的存储容量 (GB)。 不支持。 不支持。 参数 volume_size。默认为 30GB。
加密容器之间的流量 用于指定训练作业是否对训练容器之间的流量进行加密的标签。 不适用。默认已启用。 不适用。默认已启用。 参数 encrypt_inter_container_traffic。默认值为 True
配置作业加密 一个指示符,指示您要加密笔记本作业输出和/或作业实例卷。 字段 Configure job encryption。选中此框可选择加密。如果不选中此框,则作业输出将使用账户的默认 KMS 密钥加密,而作业实例卷不会加密。 与 Studio 相同。 不支持。
输出加密 KMS 密钥 当您想自定义用于笔记本作业输出的加密密钥时要使用的 KMS 密钥。仅当您选中了配置作业加密时,此字段才适用。 字段 Output encryption KMS key。如果您未指定此字段,则笔记本作业输出将使用默认 Amazon S3 KMS 密钥通过 SSE-KMS 进行加密。此外,如果您自己创建 Amazon S3 存储桶并使用加密,则会保留您的加密方法。 与 Studio 相同。对于此字段,您可以设置自己的用户默认值,只要您创建新的作业定义,就会预填充该默认值。有关详细信息,请参阅为本地笔记本设置默认选项 参数 s3_kms_key。默认值为 None。允许智能默认设置。
作业实例卷加密 KMS 密钥 当您想加密作业实例卷时要使用的 KMS 密钥。仅当您选中了配置作业加密时,此字段才适用。 字段 Job instance volume encryption KMS key 字段 Job instance volume encryption KMS key。对于此字段,您可以设置自己的用户默认值,只要您创建新的作业定义,就会预填充该默认值。有关详细信息,请参阅为本地笔记本设置默认选项 参数 volume_kms_key。默认值为 None。允许智能默认设置。
使用 Virtual Private Cloud 运行此作业(适用于 VPC 用户) 一个指示符,指示您要在 Virtual Private Cloud (VPC) 中运行此作业。为了提高安全性,建议您使用私有 VPC。 字段 Use a Virtual Private Cloud to run this job。如果您想使用 VPC,请选中此框。至少创建以下 VPC 终端节点,使您的笔记本作业能够私下连接到这些 AWS 资源:
如果选择使用 VPC,则需要在以下选项中指定至少一个私有子网和至少一个安全组。如果不使用任何私有子网,则需要考虑其他配置选项。有关详细信息,请参阅约束和注意事项中的不支持的公有 VPC 子网
与 Studio 相同。 不适用
子网(适用于 VPC 用户) 您的子网。此字段必须包含至少一个子网,最多五个子网,并且提供的所有子网都应为私有子网。有关详细信息,请参阅约束和注意事项中的不支持的公有 VPC 子网 字段 Subnet。此字段默认为与 Studio 域关联的子网,但您可以根据需要更改此字段。 字段 Subnet。调度器无法检测到您的子网,因此您需要输入为 VPC 配置的任何子网。 参数 subnets。默认值为 None。允许智能默认设置。
安全组(适用于 VPC 用户) 您的安全组。此字段必须包含至少一个安全组,最多 15 个安全组。有关详细信息,请参阅约束和注意事项中的不支持的公有 VPC 子网 字段 Security groups。此字段默认为与域 VPC 关联的安全组,但您可以根据需要更改此字段。 字段 Security groups。调度器无法检测到您的安全组,因此您需要输入为 VPC 配置的任何安全组。 参数 security_group_ids。默认值为 None。允许智能默认设置。
名称 笔记本作业步骤的名称。 不适用 不适用 参数 name。如果未指定,则从笔记本文件名导出。
显示名称 您的作业名称应出现在管道执行列表中。 不适用 不适用 参数 display_name。默认值为 None
描述 描述您的作业。 不适用 不适用 参数 description
隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。