将基于 Git 的存储库与 EMR Notebooks 关联 - Amazon EMR

将基于 Git 的存储库与 EMR Notebooks 关联

注意

EMR Notebooks 在新控制台中作为 Amazon EMR Studio Workspaces 提供。您仍然可以在旧控制台中使用现有笔记本,但无法在其中创建新笔记本。新控制台中的创建 Workspace 按钮将取代此功能。要访问或创建 Workspaces,EMR Notebooks 用户需要额外的 IAM 角色权限。有关更多信息,请参阅 Amazon EMR Notebooks are Amazon EMR Studio Workspaces in new console(Amazon EMR Notebooks 在新控制台中为 Amazon EMR Studio Workspaces)和 What's new in the console?(控制台中有哪些新功能?)

可以将基于 Git 的存储库与 Amazon EMR Notebooks 关联,以将笔记本保存在版本控制的环境中。一个笔记本最多可与三个存储库关联。支持以下基于 Git 的服务:

将基于 Git 的存储库与您的笔记本相关联后,将会获得以下优势。

  • 版本控制 – 您可以在版本控制系统中记录代码更改,以便查看更改历史记录并有选择地撤消一些更改。

  • 协作 – 在不同笔记本中工作的同事可以通过基于 Git 的远程存储库共享代码。笔记本可以从远程存储库克隆或合并代码,然后将更改推送回这些远程存储库。

  • 代码重用 – 许多演示数据分析或机器学习技术的 Jupyter notebook 可在公开托管的存储库上提供,例如 GitHub。可以将您的笔记本与存储库关联,以便重用包含在该存储库中的 Jupyter notebook。

要将基于 Git 的存储库与 EMR Notebooks 结合使用,请在 Amazon EMR 控制台中添加存储库作为资源,关联需要身份验证的存储库的凭证,然后将这些存储库与笔记本链接起来。您可在 Amazon EMR 控制台中查看存储在账户中的存储库列表以及各个存储库的详细信息。在创建基于 Git 的现有存储库时,可以将这些存储库与笔记本关联。