Amazon SageMaker - Amazon Timestream

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker

您可以使用亚马逊 SageMaker 笔记本将您的机器学习模型与 Amazon Timestream 集成。为了帮助您入门,我们创建了一个处理来自 Timestream 的数据的示例 SageMaker 笔记本。数据从持续发送数据的多线程 Python 应用程序插入到 Timestream 中。示例 SageMaker 笔记本和示例 Python 应用程序的源代码可在中找到 GitHub。

  1. 按照和中所述的说明创建数据库创建 数据库和表 创建表

  2. 按照中的说明克隆多线程 Python 示例应用程序的 GitHub 存储库 GitHub

  3. 按照中的说明克隆示例 Timestream SageMaker 笔记本的 GitHub 存储库。 GitHub

  4. 按照 Timestream 中的说明运行应用程序,持续将数据提取到 Timestream 中 README

  5. 按照此所述的说明为亚马逊创建 Amazon SageMaker S3 存储桶。

  6. 创建安装了最新 boto3 的 Amazon SageMaker 实例:除了此处描述的说明外,还要按照以下步骤操作:

    1. 在 “创建笔记本实例” 页面上,单击 “其他配置

    2. 点击生命周期配置-可选,然后选择创建新的生命周期配置

    3. 创建生命周期配置向导框中,执行以下操作:

      1. 在配置中填写所需的名称,例如 on-start

      2. 在 “启动笔记本” 脚本中,从 Github 复制粘贴脚本内容

      3. 在粘贴PACKAGE=scipy的脚本PACKAGE=boto3中替换为。

  7. 点击创建配置

  8. 前往 AWS 管理控制台中的IAM服务,找到为笔记本实例新创建的 SageMaker执行角色。

  9. 将的IAM策略附加AmazonTimestreamFullAccess到执行角色。

    注意

    AmazonTimestreamFullAccessIAM政策不限于特定资源,不适合生产用途。对于生产系统,可以考虑使用限制对特定资源的访问的策略。

  10. 当笔记本实例的状态为时 InService,选择 Ope n Jupyter 为该实例启动 SageMaker 笔记本

  11. 选择 “上传” 按钮Timestream_SageMaker_Demo.ipynb将文件timestreamquery.py上传到笔记本中

  12. 选择 Timestream_SageMaker_Demo.ipynb

    注意

    如果你看到弹出的 “未找到内核”,请选择 conda_python3 并单击 “设置内核”。

  13. 修改DB_NAMETABLE_NAMEbucket、和ENDPOINT以匹配训练模型的数据库名称、表名、S3 存储桶名称和区域。

  14. 选择播放图标来运行各个单元格

  15. 当你到达单元时Leverage Timestream to find hosts with average CPU utilization across the fleet,请确保输出返回至少 2 个主机名。

    注意

    如果输出中的主机名少于 2 个,则可能需要重新运行示例 Python 应用程序,将数据提取到 Timestream 中,线程数和主机规模都更大。

  16. 当你到达牢房时Train a Random Cut Forest (RCF) model using the CPU utilization historytrain_instance_type根据训练作业的资源要求进行更改

  17. 当你到达单元时Deploy the model for inferenceinstance_type根据推理任务的资源要求进行更改

    注意

    训练模型可能需要几分钟。训练完成后,您将在单元格的输出中看到 “已完成-训练作业已完成” 消息。

  18. 运行单元Stop and delete the endpoint以清理资源。您也可以从 SageMaker 控制台停止和删除实例