(可选)迁移自定义镜像和生命周期配置 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

(可选)迁移自定义镜像和生命周期配置

您必须更新您的自定义映像和生命周期配置 (LCC) 脚本,才能在 Amazon SageMaker Studio 中使用简化的本地运行模型。如果您尚未在域中创建自定义映像或生命周期配置,请跳过此阶段。

Amazon SageMaker Studio Classic 在分体式环境中运行,

  • 运行的JupyterServer应用程序 Jupyter Server.

  • 在一个或多个KernelGateway应用程序上运行的 Studio Classic 笔记本电脑。

Studio 已经摆脱了分体式环境。Studio 在本地运行时模型中基于代码OSS、Visual Studio Code-开源应用程序运行 JupyterLab 和代码编辑器。有关架构变更的更多信息,请参阅在 Amazon SageMaker Studio 上提高工作效率

迁移自定义镜像

您现有的 Studio 经典版自定义图像可能无法在 Studio 中使用。我们建议创建满足在 Studio 中使用要求的新自定义映像。Studio 的发布通过提供,简化了构建自定义映像的过程SageMaker 分发图片。 SageMaker分发图像包括用于机器学习、数据科学和数据分析可视化的常用库和软件包。有关基本 SageMaker 分发映像列表和 Amazon Elastic Container Registry 账户信息,请参阅亚马逊 SageMaker 图片可用于 Studio Classic

要构建自定义镜像,请完成以下任一操作。

  • 使用自定义包和模块扩展 SageMaker 分发映像。这些图像预先配置了基于代码 JupyterLab 、Visual Studio Code-开源的代码编辑器和代码编辑器。OSS

  • 按照中的说明生成自定义 Dockerfile 文件。Dockerfile 规格你必须安装 JupyterLab 还有开源 CodeServer 在图像上使其与 Studio 兼容。

迁移生命周期配置

由于 Studio 中简化了本地运行时模型,因此我们建议迁移现有 Studio Classic 的结构LCCs。在 Studio Classic 中,您通常必须为两者创建单独的生命周期配置 KernelGateway 以及 JupyterServer 应用程序。因为 JupyterServer 以及 KernelGateway 应用程序在 Studio Classic 中的不同计算资源上运行,Studio Classic LCCs 可以是以下任一类型:

  • JupyterServer LCC:它们LCCs主要控制用户的主控操作,包括设置代理、创建环境变量和自动关闭资源。

  • KernelGateway LCC:这些LCCs控制了 Studio Classic 笔记本环境的优化。这包括在内核中更新 numpy 软件包版本以及在Data Science 3.0内核中安装 snowflake 软件包。Pytorch 2.0 GPU

在简化的 Studio 架构中,您只需要一个在应用程序启动时运行的LCC脚本。虽然LCC脚本的迁移因开发环境而异,但我们建议将脚本的迁移方式结合起来 JupyterServer 以及 KernelGateway LCCs来建造一个组合LCC。

LCCs在 Studio 中可以与以下应用程序之一相关联:

  • JupyterLab

  • 代码编辑器

用户可以在创建空间时LCC为相应的应用程序类型选择,也可以使用管理员LCC设置的默认设置。

注意

现有的 Studio 经典版自动关闭脚本不适用于 Studio。有关 Studio 自动关闭脚本的示例,请参阅 SageMaker Studio 生命周期配置示例

重构时的注意事项 LCCs

在重构时,请考虑 Studio Classic 和 Studio 之间的以下区别。LCCs

  • JupyterLab 而且,代码编辑器应用程序在创建后将sagemaker-userUID:1001和一样运行GID:101。默认情况下,sagemaker-user具有承担 sudo/root 权限的权限。KernelGateway 默认情况下,应用程序root按默认方式运行。

  • SageMaker 内部运行的分发图像 JupyterLab 和代码编辑器应用程序使用 Debian基于软件包管理器,apt-get

  • Studio JupyterLab 和代码编辑器应用程序使用 Conda 包管理器。 SageMaker 创建单一基地 Python3 Conda 启动 Studio 应用程序时的环境。有关更新基础软件包的信息 Conda 环境和创造新的 Conda 环境,请参阅JupyterLab 用户指南。相比之下,并非全部 KernelGateway 应用程序使用 Conda 作为软件包管理器。

  • Studio JupyterLab 应用程序使用JupyterLab 4.0,而 Studio 经典应用程序使用JupyterLab 3.0。验证这一切 JupyterLab 您使用的扩展程序与之兼容JupyterLab 4.0。有关扩展的更多信息,请参阅扩展与 JupyterLab 4.0 的兼容性