OPS02-BP02 流程和程序已确定所有者 - 卓越运营支柱

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

OPS02-BP02 流程和程序已确定所有者

了解谁负责定义各个流程和程序、为何使用这些特定的流程和程序,以及为何应由此人负责。了解使用特定流程和程序的原因有助于发现改进机会。

期望结果:针对运营任务,组织制定了一套明确定义并良好维护的流程和程序。流程和程序集中存储在一个位置,可供团队成员使用。按照明确指派的责任归属,经常更新流程和程序。尽可能将脚本、模板和自动化文档作为代码实施。

常见反模式:

  • 流程未记录在案。脚本呈现碎片化,可能分布在许多孤立的操作员工作站上。

  • 脚本的使用方法只有少数人了解,或作为团队知识非正式地交流。

  • 旧的流程需要更新,但不明确应由谁负责更新,原作者已离开了组织。

  • 无法发现流程和脚本,因此在需要时(例如,在响应意外事件时)无法使用。

建立此最佳实践的好处:

  • 流程和程序可改进运行工作负载的工作。

  • 新的团队成员可以更快地投入工作中。

  • 缩短了缓解意外事件的用时。

  • 不同的团队成员(以及不同的团队)可以一致地使用相同的流程和程序。

  • 团队可以使用可重复的流程来扩展其流程。

  • 在团队之间移交工作负载责任时,标准化的流程和程序有助于减轻移交造成的影响。

在未建立这种最佳实践的情况下暴露的风险等级:

实施指导

  • 确定了负责定义流程和程序的负责人。

    • 确定为支持工作负载而开展的运营活动。将这些活动记录在易于发现的位置。

    • 唯一标识负责活动规范的个人或团队。他们负责确保由技能娴熟且具有正确的权限、访问权限和工具的团队成员来成功执行活动。如果执行该活动时遇到问题,执行活动的团队成员有责任提供详细反馈,用于推进活动改进。

    • 通过 S AWS ystems Manager 等服务、文档和,获取活动对象元数据的所有权 AWS Lambda。使用标签或资源组收集资源责任信息,详细说明负责人和联系信息。 AWS Organizations 用于创建标签策略并获取所有权和联系信息。

  • 随着时间推移,这些程序应该逐步进化为可以作为代码运行,从而减少人工干预的需求。

    • 例如,考虑 AWS Lambda 函数、 CloudFormation模板或 S AWS ystems Manager 自动化文档。

    • 在相应的存储库中执行版本控制。

    • 包括适当的资源标记,以便可以轻松识别负责人和文档。

客户示例

AnyCompany 零售业将所有权定义为拥有一个或多个应用程序组(共享共同架构实践和技术)的流程的团队或个人。最初,流程和程序以 step-by-step指南形式记录在文档管理系统中,使用托管应用程序的 AWS 账户 标签和账户内特定资源组上的标签即可发现。他们利用 AWS Organizations 来管理自己 AWS 账户的. 随着时间的推移,这些过程会转换为代码,并使用基础架构即代码(例如 CloudFormation 或 AWS Cloud Development Kit (AWS CDK) 模板)定义资源。操作流程变成 S AWS ystems Manager 中的自动化文档或 AWS Lambda 功能,这些文档可以作为计划任务启动,以响应 AWS CloudWatch 警报或 AWS EventBridge 事件等事件,也可以通过 IT 服务管理 (ITSM) 平台中的请求启动。所有流程都有标签,用于标识负责人。用于自动化和流程的文档,保存在由该流程的代码存储库生成的 Wiki 页面中。

实施步骤

  1. 记录现有的流程和程序。

    1. 查看并保留它们 up-to-date。

    2. 确定每个流程或程序的负责人。

    3. 对流程和程序实施版本控制。

    4. 只要可能,对具有相同架构设计的工作负载和环境,共享流程和程序。

  2. 建立反馈和改进机制。

    1. 定义有关流程审查频率的政策。

    2. 定义审核者和审批者流程。

    3. 实施问题队列或票证队列,以便提供和跟踪反馈。

    4. 只要有可能,流程和程序都应获得变更批准委员会的预先批准和风险分类 () CAB。

  3. 确认需要运行这些流程和程序的人员能够访问和搜索到流程和程序。

    1. 使用标签来指示可以在哪里访问工作负载的流程和程序。

    2. 使用有意义的错误和事件消息,指明用于解决问题的正确流程或程序。

    3. 使用 Wiki 和文档管理,确保可在整个组织内一致地搜索流程和程序。

  4. 在适当时实现自动化。

    1. 当服务和技术提供自动化时,应开发自动化。API

    2. 针对流程充分开展培训。开发用户案例和要求,用于实现这些流程的自动化。

    3. 衡量流程和程序的成功使用情况,并提出问题来支持迭代改进。

实施计划的工作量级别:

资源

相关最佳实践:

相关文档:

相关讲习会:

相关视频:

相关服务: