R 亚马逊用户指南 SageMaker - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

R 亚马逊用户指南 SageMaker

本文档将引导您了解使用 R 利用 Amazon SageMaker 功能的方法。本指南介绍了内置 SageMaker的 R 内核、如何开始使用 R SageMaker,最后还有几个示例笔记本。

这些示例分为三个级别:初级、中级和高级。他们从开启 R 的入门开始 SageMaker,在开启 R 的情况下继续进行 end-to-end 机器学习,然后再讲更高级的主题 SageMaker,例如使用 R 脚本进行 SageMaker处理和 Bring-Your-Own (BYO) R 算法。 SageMaker 

有关如何将自己的自定义 R 映像带入 Studio 中的信息,请参阅带上你自己的 SageMaker 图片。有关类似的博客文章,请参阅将您自己的 R 环境引入 Amazon SageMaker Studio

rStudio Support SageMaker

亚马逊 SageMaker 支持 rStudio 作为与亚马逊域集成的完全托管的集成开发环境 (IDE)。 SageMaker 通过 RStudio 集成,你可以在域中启动 RStudio 环境,在资源上运行 RStudio 工作流程。 SageMaker 有关更多信息,请参阅 亚马逊上的 RStudio SageMaker

R 内核在 SageMaker

SageMaker 笔记本实例使用预安装的 R 内核支持 R。此外,R 内核还有网状库,一个 R 到 Python 接口,因此你可以在 R 脚本中使用 Pyt SageMaker hon SDK 的功能。

开始使用 R SageMaker

  •  使用 t2.medium 实例类型和默认存储大小创建笔记本实例。如果您打算继续将该实例用于更高级的示例,或者以后创建更大的实例,您可以选择更快的实例和更多的存储空间。

  • 等到笔记本状态变为“In Service”(正在使用),然后单击 Open Jupyter (打开 Jupyter)。

  • 从可用的环境列表中创建一个具有 R 内核的新笔记本。 

  • 在创建了新的笔记本时,您将会在笔记本环境的右上角看到 R 徽标,并且还会在该徽标下看到内核为 R。这表示 SageMaker 已成功启动此笔记本的 R 内核。

  • 或者,在您位于 Jupyter 笔记本时,您可以使用 Kernel (内核) 菜单,然后从 Change Kernel (更改内核) 选项中选择 R。

示例笔记本

先决条件

R 入门 SageMaker:此示例笔记本描述了如何使用亚马逊 SageMaker的 R 内核开发 R 脚本。在此笔记本中,您可以设置 SageMaker 环境和权限,从 UCI Machine Learning Re pository 下载鲍鱼数据集,对数据进行一些基本处理和可视化,然后将数据保存为.csv 格式到 S3。

初级

SageMaker使用 R 内核进行批量转换:此示例笔记本描述了如何使用 SageMaker的 Transformer API 和 XGBoost 算法执行批量转换作业。 笔记本还使用 Abalone 数据集。

中级

R 中的 XGBoost 超参数优化:该示例笔记本扩展了前面使用鲍鱼数据集和 XGBoost 的初级笔记本。它介绍了如何使用超参数优化进行模型优化。您还会了解如何使用批量转换进行批量预测,以及如何创建模型端点以进行实时预测。 

使用 R 的 Amazon SageMaker Process SageMakering:Processing 允许您对模型评估工作负载进行预处理、后处理和运行。该示例说明了如何创建 R 脚本以编排处理作业。 

高级

训练和部署你自己的 R 算法 SageMaker:你是否已经有一个 R 算法,想把它带进 SageMaker 来调整、训练或部署它? 此示例将引导您了解如何使用自定义 R 包自定义 SageMaker 容器,一直到使用托管端点对 R-Origin 模型进行推理。