第 5 步。运行管道 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第 5 步。运行管道

运行管道。

此步骤运行步骤 4 中在 AWS CloudFormation 堆栈中创建的训练或推理管道。在内部占位符参数被填充为具体指之前,管道无法运行。为占位符参数赋值的操作是第 5 步的主要活动。占位符的示例参数包括:

  • 输入、输出和中间数据集的位置

  • 在第 2 步中开发的运行时脚本和其他预处理或评估代码的 Amazon S3 位置(例如,用于训练管道的 sm_submit_url

  • 该 AWS 地区的名称

在运行管道之前,必须确保这些路径值指向有效的数据或代码。例如,如果您填充了代表 Python 运行时脚本的 Amazon S3 URL 的占位符参数,则必须将这些脚本上传到该 URL。管道的运行人员负责一致性检查和数据上传。定义或创建管道的人不必担心这些问题。

根据管道的成熟度,此步骤可能会自动定期(每周或每月)运行。自动化还需要强有力的监控,这是一个重要的领域,但不在本指南的讨论范围内。对于训练管道的运行,监控评估指标是合适的。对于推断管道而言,监控输入数据分布偏差是合适的,如果可能的话,定期收集标签并测量预测准确性的偏差。这些来自训练和推理运行的记录应记录在数据库中,以便日后进行分析。