步骤 6. 扩大管道

本指南介绍了如何使用具体架构 AWS 快速开始构建机器学习管道。在完善管道过程中，还需要考虑其他注意事项，例如元数据管理、实验跟踪和监控。这些重要主题不在本指南的讨论范围内。以下各节讨论管道管理的另一个方面，即管道自动化。

不同级别的自动化

尽管您可以在 SageMaker AI 控制台中手动设置训练管道，但实际上，我们建议在部署机器学习训练管道时尽量减少手动接触点，以确保机器学习模型得到一致且重复的部署。根据您的要求和要解决的业务问题，您可以确定并实施三个层次的部署策略：半自动、全自动和完全托管。

半自动：默认情况下，上一节讨论的步骤采用半自动方法，因为它们通过使用 AWS CloudFormation 模板来部署训练和推理管道。这有助于确保管道的可重复性，并帮助您轻松更改和更新管道。
完全自动化 — 更高级的选择是使用持续集成和持续部署（培训管道部署的CI/CD) to the development, staging, and production environments. Incorporating CI/CD实践可以确保自动化包括可追溯性和质量门）。
完全托管 — 最终，您可以开发一个完全托管的系统，这样您就可以部署带有一组简单清单的机器学习训练管道，并且系统可以自行配置和协调所需的 AWS 服务。

在本指南中，我们选择介绍一个具体的架构。但您可以考虑使用其他技术。接下来的两节将讨论平台和编排引擎的一些替代选择。

Amazon SageMaker AI 是一项用于训练和提供机器学习模型的 AWS 托管服务。许多用户都喜欢它的各种内置功能以及它为运行机器学习工作负载提供的许多选项。 SageMaker 如果你刚刚开始在云端实施机器学习，那么人工智能特别有用。 SageMaker 人工智能的主要特点包括：

使用 SageMaker 人工智能的替代方法之一是AWS Batch。 AWS Batch 为您的环境提供对计算和编排的较低级别的控制，但它不是为机器学习而定制的。它的一些主要功能包括：

第二个主要组件是管道编排层。 AWS 提供 Step Func tions，提供完全托管的编排体验。Apache Airflow 是 Step Functions 的热门替代方案。在两者之间做出决定时，请考虑以下事项：

必需的基础架构 — AWS Step Functions 是一项完全托管的服务，并且是无服务器的，而 Airflow 需要管理您自己的基础架构，并且基于开源软件。因此， Step Functions 可提供开箱即用的高可用性，而管理 Apache Airflow 则需要额外的步骤。
调度功能 — Step Functions 和 Airflow 均提供类似的功能。
可视化功能和用户界面 — Step Functions 和 Airflow 均提供类似的功能。
在计算图中传递变量 — Step Functions 提供的 AWS Lambda 函数使用功能有限，而 Airflow 提供 XCom 接口。
用法 — Step Functions 在 AWS 客户中非常受欢迎，Airflow 已被数据工程界广泛采用。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。