(可选)迁移自定义映像和生命周期配置 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

(可选)迁移自定义映像和生命周期配置

您必须更新您的自定义映像和生命周期配置 (LCC) 脚本,才能在 Amazon SageMaker Studio 中使用简化的本地运行模型。如果您尚未在域中创建自定义映像或生命周期配置,请跳过此阶段。

Amazon SageMaker Studio Classic 在分体式环境中运行,

  • 运行的JupyterServer应用程序 Jupyter Server.

  • 在一个或多个 KernelGateway 应用程序上运行的 Studio Classic 笔记本电脑。

Studio 已经摆脱了分离式环境。Studio 在本地运行时模型中运行基于 Code-OSS、Visual Studio Code-开源应用程序的 JupyterLab 和代码编辑器。有关架构变更的更多信息,请参阅在 Amazon SageMaker Studio 上提高工作效率

迁移自定义映像

您现有的 Studio Classic 自定义映像可能无法在 Studio 中使用。我们建议创建满足在 Studio 中使用要求的新自定义映像。Studio 的发布通过提供,简化了构建自定义映像的过程SageMaker 工作室图片支持政策。 SageMaker AI Distribution 图像包括用于机器学习、数据科学和数据分析可视化的常用库和软件包。有关基本 SageMaker 分发映像列表和 Amazon Elastic Container Registry 账户信息,请参阅亚马逊 SageMaker AI 图像可用于 Studio Classic

要构建自定义映像,请完成以下操作之一。

  • 使用自定义包和模块扩展 SageMaker 分发映像。这些图像预先配置了代码编辑器,基于 Code-OSS、Visual Studio Code-Open Source。 JupyterLab

  • 按照 Dockerfile 规范 中的说明创建自定义 Dockerfile 文件。你必须安装 JupyterLab 还有开源 CodeServer 在图像上使其与 Studio 兼容。

迁移生命周期配置

由于 Studio 中简化了本地运行时模型,因此我们建议迁移现有 Studio Classic 的结构 LCCs。在 Studio Classic 中,您通常必须为两者创建单独的生命周期配置 KernelGateway 以及 JupyterServer 应用程序。因为 JupyterServer 以及 KernelGateway 应用程序在 Studio Classic 中的不同计算资源上运行,Studio Classic LCCs 可以是以下任一类型:

  • JupyterServer LCC:它们 LCCs 主要控制用户的主控操作,包括设置代理、创建环境变量和自动关闭资源。

  • KernelGateway LCC:这些 LCCs 控制了 Studio Classic 笔记本电脑环境的优化。这包括更新 Data Science 3.0 内核中的 numpy 软件包版本和在 Pytorch 2.0 GPU 内核中安装 snowflake 软件包。

在简化的 Studio 架构中,您只需要一个在应用程序启动时运行的 LCC 脚本。虽然 LCC 脚本的迁移因开发环境而异,但我们建议将脚本合并 JupyterServer 以及 KernelGateway LCCs 来构建一个组合的 LCC。

LCCs 在 Studio 中可以与以下应用程序之一相关联:

  • JupyterLab

  • 代码编辑器

用户可以在创建空间时为相应的应用程序类型选择 LCC,也可以使用管理员设置的默认 LCC。

注意

现有的 Studio Classic 自动关闭脚本不能与 Studio 一起使用。有关 Studio 自动关闭脚本的示例,请参阅 SageMaker Studio 生命周期配置示例

重构时的注意事项 LCCs

在重构时,请考虑 Studio Classic 和 Studio 之间的以下区别。 LCCs

  • JupyterLab 而且,代码编辑器应用程序在创建后将sagemaker-userUID:1001和一样运行GID:101。默认情况下,sagemaker-user具有承担 sudo/root 权限的权限。KernelGateway 默认情况下,应用程序root按默认方式运行。

  • SageMaker 内部运行的分发图像 JupyterLab 和代码编辑器应用程序使用 Debian基于软件包管理器,apt-get

  • Studio JupyterLab 和代码编辑器应用程序使用 Conda 包管理器。 SageMaker AI 创造了单一基地 Python3 Conda 启动 Studio 应用程序时的环境。有关更新基础软件包的信息 Conda 环境和创造新的 Conda 环境,请参阅JupyterLab 用户指南。相比之下,并非全部 KernelGateway 应用程序使用 Conda 作为软件包管理器。

  • Studio JupyterLab 应用程序使用JupyterLab 4.0,而 Studio 经典应用程序使用JupyterLab 3.0。验证这一切 JupyterLab 您使用的扩展程序与之兼容JupyterLab 4.0。有关扩展的更多信息,请参阅扩展与 JupyterLab 4.0 的兼容性