Amazon SageMaker 域 - Amazon SageMaker

Amazon SageMaker 域

Amazon SageMaker 域支持 SageMaker 机器学习 (ML) 环境。SageMaker 域由以下实体组成。有关创建域的加入步骤,请参阅加入 Amazon SageMaker 域

  • :Amazon SageMaker 域由关联的 Amazon Elastic File System (Amazon EFS) 卷、授权用户列表以及各种安全、应用程序、策略和 Amazon Virtual Private Cloud (Amazon VPC) 配置组成。域中的用户可以彼此共享笔记本文件和其他构件。一个账户可以有多个域。有关多个域的更多信息,请参阅多个域概述

  • UserProfile:一个用户配置文件代表域中的一个用户。这是引用用户以实现共享、报告和其他面向用户的特征的主要方式。此实体是在用户加入 Amazon SageMaker 域时创建。有关配置文件的更多信息,请参阅域用户配置文件

  • 共享空间:共享空间由共享的 JupyterServer 应用程序和共享目录组成。域中的所有用户都可以访问共享空间。域中的所有用户配置文件都可以访问该域中的所有共享空间。有关共享空间的更多信息,请参阅使用共享空间进行协作

  • 应用程序:应用程序表示支持用户笔记本电脑、终端和控制台的阅读和执行体验的应用程序。应用程序的类型可以是 JupyterServer、KernelGateway、RStudioServerPro 或 RSession。用户可能同时激活多个应用程序。

下列各表描述了 DomainUserProfileshared spaceApp 实体的状态值。在适用情况下,它们还提供了问题排查步骤。

域状态值
描述
Pending 正在创建域。
InService 成功创建域。
Updating 正在更新域。
Deleting 正在删除域。
Failed 域创建失败。调用 DescribeDomain API 以查看域创建失败的原因。修复 FailureReason 中提到的错误后,删除失败的域并重新创建该域。
Update_Failed 域更新失败。调用 DescribeDomain API 以查看域更新失败的原因。修复 FailureReason 中提到的错误后,调用 UpdateDomain API。
Delete_Failed 域删除失败。调用 DescribeDomain API 以查看域删除失败的原因。由于删除失败,可能有一些资源仍在运行,但您无法使用或更新域。修复 FailureReason 中提到的错误后,再次调用 DeleteDomain API。
UserProfile 状态值
描述
Pending 正在创建 UserProfile
InService 成功创建 UserProfile
Updating 正在进行更新 UserProfile
Deleting 正在删除 UserProfile.
Failed UserProfile 创建失败。调用 DescribeUserProfile API 以查看 UserProfile 创建失败的原因。修复 FailureReason 中提到的错误后,删除失败的 UserProfile 并重新创建它。
Update_Failed UserProfile 更新失败。调用 DescribeUserProfile API 以查看 UserProfile 更新失败的原因。修复 FailureReason 中提到的错误后,再次调用 UpdateUserProfile API。
Delete_Failed UserProfile 删除失败。调用 DescribeUserProfile API 以查看 UserProfile 删除失败的原因。由于删除失败,可能有一些资源仍在运行,但您无法使用或更新 UserProfile。修复 FailureReason 中提到的错误后,再次调用 DeleteUserProfile API。
共享空间状态值
描述
Pending 正在创建共享空间。
InService 成功创建共享空间。
Deleting 正在删除共享空间。
Failed 共享空间创建失败。调用 DescribeSpace API 以查看共享空间创建失败的原因。修复 FailureReason 中提到的错误后,删除失败的共享空间并重新创建它。
Update_Failed 共享空间更新失败。调用 DescribeSpace API 以查看共享空间更新失败的原因。修复 FailureReason 中提到的错误后,再次调用 UpdateSpace API。
Delete_Failed 共享空间删除失败。调用 DescribeSpace API 以查看共享空间删除失败的原因。由于删除失败,可能有一些资源仍在运行,但您无法使用或更新共享空间。修复 FailureReason 中提到的错误后,再次调用 DeleteSpace API。
Deleted 成功删除共享空间。
App 状态值
描述
Pending 正在创建 App
InService 成功创建 App
Deleting 正在删除 App
Failed App 创建失败。调用 DescribeApp API 以查看 App 创建失败的原因。修复 FailureReason 中提到的错误后,再次调用 CreateApp API。
Deleted 成功删除 App

应用程序维护

SageMaker 至少每 90 天对 Amazon SageMaker Studio JupyterServer 和 KernelGateway、SageMaker Canvas 和 Amazon SageMaker Data Wrangler 应用程序的底层软件进行一次安全和性能更新。某些维护项目(如操作系统升级)要求 SageMaker 在维护时段内让您的应用程序短时间离线。由于此维护会使应用程序离线,因此在更新底层软件期间不能执行任何操作。当维护活动正在进行时,应用程序的状态将从 InService 变为 Pending。维护完成后,应用程序的状态将恢复为 InService。如果修补失败,则应用程序的状态将变为 Failed。如果应用程序处于 Failed 状态,我们建议创建相同类型的新应用程序。有关创建 Studio 应用程序的信息,请参阅关闭并更新 SageMaker Studio 和 Studio 应用程序。有关创建 SageMaker Canvas 应用程序的信息,请参阅管理应用程序

有关更多信息,请联系 https://aws.amazon.com/premiumsupport/。