本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon SageMaker
您可以使用亚马逊 SageMaker 笔记本将您的机器学习模型与 Amazon Timestream 集成。为了帮助您入门,我们创建了一个处理来自 Timestream 的数据的示例 SageMaker 笔记本。数据从持续发送数据的多线程 Python 应用程序插入到 Timestream 中。示例 SageMaker 笔记本和示例 Python 应用程序的源代码可在中找到 GitHub。
-
按照中的说明克隆多线程 Python 示例应用程序
的 GitHub 存储库 GitHub -
按照中的说明克隆示例 Timestream SageMaker 笔记本
的 GitHub 存储库。 GitHub -
按照 Timestream 中的说明运行应用程序,持续将数据提取到 Timestream 中 README
-
按照此处所述的说明为亚马逊创建 Amazon SageMaker S3 存储桶。
-
创建安装了最新 boto3 的 Amazon SageMaker 实例:除了此处描述的说明外,还要按照以下步骤操作:
-
在 “创建笔记本实例” 页面上,单击 “其他配置”
-
点击生命周期配置-可选,然后选择创建新的生命周期配置
-
在创建生命周期配置向导框中,执行以下操作:
-
在配置中填写所需的名称,例如
on-start
-
在粘贴
PACKAGE=scipy
的脚本PACKAGE=boto3
中替换为。
-
-
-
点击创建配置
-
前往 AWS 管理控制台中的IAM服务,找到为笔记本实例新创建的 SageMaker执行角色。
-
将的IAM策略附加
AmazonTimestreamFullAccess
到执行角色。注意
该
AmazonTimestreamFullAccess
IAM政策不限于特定资源,不适合生产用途。对于生产系统,可以考虑使用限制对特定资源的访问的策略。 -
当笔记本实例的状态为时 InService,选择 Ope n Jupyter 为该实例启动 SageMaker 笔记本
-
选择 “上传” 按钮
Timestream_SageMaker_Demo.ipynb
将文件timestreamquery.py
上传到笔记本中 -
选择
Timestream_SageMaker_Demo.ipynb
注意
如果你看到弹出的 “未找到内核”,请选择 conda_python3 并单击 “设置内核”。
-
修改
DB_NAME
TABLE_NAME
、bucket
、和ENDPOINT
以匹配训练模型的数据库名称、表名、S3 存储桶名称和区域。 -
选择播放图标来运行各个单元格
-
当你到达单元时
Leverage Timestream to find hosts with average CPU utilization across the fleet
,请确保输出返回至少 2 个主机名。注意
如果输出中的主机名少于 2 个,则可能需要重新运行示例 Python 应用程序,将数据提取到 Timestream 中,线程数和主机规模都更大。
-
当你到达牢房时
Train a Random Cut Forest (RCF) model using the CPU utilization history
,train_instance_type
根据训练作业的资源要求进行更改 -
当你到达单元时
Deploy the model for inference
,instance_type
根据推理任务的资源要求进行更改注意
训练模型可能需要几分钟。训练完成后,您将在单元格的输出中看到 “已完成-训练作业已完成” 消息。
-
运行单元
Stop and delete the endpoint
以清理资源。您也可以从 SageMaker 控制台停止和删除实例