OPS06-BP02 测试部署 - AWS Well-Architected Framework

OPS06-BP02 测试部署

使用与生产环境相同的部署配置、安全控制、步骤和程序,在预生产环境中测试发布过程。验证所有部署步骤是否按预期完成,如检查文件、配置和服务。通过功能测试、集成测试和负载测试以及运行状况检查等各种监控方法,进一步测试所有更改。通过这些测试,您可以及早发现部署问题,并有机会在进入生产之前规划和缓解问题。

您可以创建临时的并行环境来测试每项更改。使用基础设施即代码(IaC)自动部署测试环境,有助于减少所涉及的工作量,确保稳定性、一致性和更快的功能交付。

期望的结果: 您的组织采用了包含测试部署在内的测试驱动型开发文化。这样可以确保团队专注于提供商业价值,而不是管理发布版本。各团队在发现部署风险后尽早参与进来,以确定适当的缓解方案。

常见反模式:

  • 在发布生产版本期间,未经测试的部署会导致问题频发,需要进行故障排除和上报。

  • 您的发布版本包含用于更新现有资源的基础设施即代码(IaC)。您不确定 IaC 是会成功运行,还是会对资源造成影响。

  • 您在应用程序中部署一项新功能。此功能未按预期运行,并且在受影响的用户报告之前都无从了解问题。

  • 您更新了证书。您不小心将证书安装到了错误的组件上,而这却没有被发现,于是因为无法建立与网站的安全连接而影响网站访客。

建立此最佳实践的好处: 在生产前对部署程序及其引入的更改进行全面测试,可最大限度地减少部署步骤对生产的潜在影响。这增强了生产版本发布过程中的信心,并最大限度地减少了运营支持,而且不会减慢更改交付速度。

未建立这种最佳实践的情况下暴露的风险等级:

实施指导

测试部署过程与测试部署所产生的更改同样重要。要完成这一步骤,可以在尽可能接近生产环境的预生产环境中测试部署步骤。可以在投入生产之前发现一些常见问题,如部署步骤不完整、不正确或配置错误。此外,您还可以测试恢复步骤。

客户示例

作为持续集成和持续交付(CI/CD,Continuous Integration/Continuous Delivery)管道的一部分,AnyCompany Retail 在类似生产的环境中执行为客户发布基础设施和软件更新所需的既定步骤。该管道包含预检查过程,用于在部署之前检测资源中的偏差(检测在 IaC 之外对资源执行的更改),以及验证 IaC 在启动时采取的操作。该管道会验证部署步骤,例如在向负载均衡器重新注册之前,验证特定文件和配置是否已准备就绪,服务是否处于正在运行状态,以及是否正确响应本地主机上的运行状况检查。此外,所有更改都要进行一系列自动测试,如功能测试、安全测试、回归测试、集成测试和负载测试。

实施步骤

  1. 执行预安装检查,模拟生产环境打造预生产环境。

    1. 使用 偏差检测 功能,检测是否在 AWS CloudFormation 之外更改了资源。

    2. 使用 更改集 功能,验证堆栈更新的意图是否与 AWS CloudFormation 在启动更改集时所采取的操作相匹配。

  2. 这会在 AWS CodePipeline 中触发手动审批步骤,以授权部署到预生产环境。

  3. 使用 AWS CodeDeploy AppSpec 文件等部署配置来定义部署和验证步骤。

  4. 在适用的情况下,可将 AWS CodeDeploy 与其他 AWS 服务集成将 AWS CodeDeploy 与合作伙伴的产品和服务集成

  5. 监控部署 - 使用 Amazon CloudWatch、AWS CloudTrail 和 Amazon SNS 事件通知。

  6. 执行部署后的自动化测试,包括功能测试、安全测试、回归测试、集成测试和负载测试。

  7. 排查 部署问题。

  8. 成功验证上述步骤后应启动手动审批工作流,以授权部署到生产环境。

实施计划的工作量级别:

资源

相关最佳实践:

相关文档:

相关视频:

相关示例: