JupyterLab 用户指南 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

JupyterLab 用户指南

本指南向 JupyterLab 用户展示了如何在 SageMaker Studio 中运行分析和机器学习工作流程。您可以获得快速存储,并根据自己的需要扩大或缩小计算规模。

JupyterLab 支持私有空间和共享空间。专用空间的作用域为域中的单个用户。共享空间可让域内其他用户与您实时协作。有关 Studio 空间的信息,请参阅 亚马逊 SageMaker Studio 空间

要开始使用 JupyterLab,请创建一个空间并启动您的 JupyterLab应用程序。运行 JupyterLab 应用程序的 JupyterLab 空间是一个空间。该 JupyterLab 空间使用单个 Amazon EC2 实例进行计算,使用单个 Amazon EBS 卷进行存储。您空间中的所有内容,如代码、git 配置文件和环境变量,都存储在同一个 Amazon EBS 卷上。该卷具有 3000 IOPS,吞吐量为每秒 125 兆字节 ()。MBps您可以使用快速存储在同一实例上打开和运行多个 Jupyter Notebook。您还可以在笔记本中快速切换内核。

您的管理员已为您的空间配置了默认 Amazon EBS 存储设置。默认存储容量为 5 GB,但您可以增加获得的空间。您可以向管理员咨询,他们会为您提供指导。

您可以切换用于运行的 Amazon EC2 实例类型 JupyterLab,根据需要向上或向下扩展计算规模。快速启动实例的启动速度比其他实例快得多。

管理员可能会为您提供可自定义环境的生命周期配置。您可以在创建空间时指定生命周期配置。

如果您的管理员授予您访问 Amazon EFS 的权限,则可以配置您的 JupyterLab空间来访问它。

默认情况下, JupyterLab 应用程序使用 SageMaker 分发映像。这包括对许多机器学习、分析和深度学习软件包的支持。不过,如果您需要自定义映像,您的管理员可以帮助您访问自定义映像。

Amazon EBS 卷的持久性与实例的生命周期无关。更换实例时不会丢失数据。使用 conda 和 pip 软件包管理库创建可重现的自定义环境,即使切换实例类型也能保持不变。

打开后 JupyterLab,您可以使用终端配置您的环境。要打开终端,请导航至启动器,然后选择终端

以下是您可以在中配置环境的不同方法的示例 JupyterLab。

注意

在 Studio 中,您可以使用生命周期配置来自定义环境,但我们建议您使用软件包管理器。使用生命周期配置是一种更容易出错的方法。添加或删除依赖关系比调试生命周期配置脚本更容易。它还可以增加 JupyterLab 启动时间。

有关生命周期配置的信息,请参阅 使用 JupyterLab 进行生命周期配置