OPS03-BP02 赋能团队成员在结果有风险时采取行动 - AWS Well-Architected 框架

OPS03-BP02 赋能团队成员在结果有风险时采取行动

由领导层灌输的主人翁文化行为,会让任何员工感到自己有能力代表整个公司行事,超越为其规定的职责和责任范围。员工可以在风险出现时主动识别风险并采取适当行动。这样的文化能够让员工在了解情况的前提下,作出高价值的决策。

例如,亚马逊使用领导力原则作为准则,推动员工实现在各种情况下前进、解决问题、处理冲突和采取行动等期望行为。

期望结果:在领导力的影响下产生了一种新文化,这种文化允许个人和团队作出关键决策,即使在组织的较低层级也是如此(只要决策是用可审核权限和安全机制定义)。失败并不可怕,团队会不断学习,改进决策和响应措施,从而应对今后出现的类似情况。如果某个人的行动带来了改进,能让其他团队受益,这些团队就会主动分享从这些行动中获得的知识。领导层衡量运营改进情况,并激励个人和组织采用此类模式。

常见反模式:

  • 组织内没有明确的指导或机制来说明在发现风险时该怎么做。例如,当员工发现网络钓鱼攻击时,他们没有向安全团队报告,导致组织中的大部分人遭受攻击。这会造成数据泄露。

  • 客户抱怨服务不可用,主要原因是部署失败。SRE 团队负责部署工具,而他们的长期路线图中包括自动回滚部署。在最近一次的应用程序推广中,一位工程师设计了一种解决方案,可以自动将应用程序回滚到以前的版本。虽然他们的解决方案可以成为 SRE 团队采用的模式,但其他团队并不采用,因为没有流程能跟踪此类改进。组织继续受到部署失败的困扰,这影响了客户,造成了更多负面情绪。

  • 为了保持合规性,信息安全团队会监督一个长期建立的流程,代表连接到 Amazon EC2 Linux 实例的操作员定期轮换共享的 SSH 密钥。信息安全团队需要花几天的时间才能完成密钥的轮换,并且您将无法连接到这些实例。信息安全团队内部和外部的任何人都不建议使用 AWS 上的其他选项来实现相同的结果。

建立此最佳实践的好处:通过下放决策权并授权团队决定关键决策,您可以更快地解决问题,并提高成功率。此外,团队开始具有主人翁意识,并意识到失败是可以接受的。实验成为一种文化主流。经理和主管不会觉得他们在工作的各个方面都受到微观管理。

在未建立这种最佳实践的情况下暴露的风险等级:

实施指导

  1. 培养一种会预见失败的文化。

  2. 明确规定组织内各职能领域的所有权和责任。

  3. 向每个人传达所有权和问责制,让大家都知道谁能帮助他们促进分散决策。

  4. 定义单向门决策和双向门决策,让个人了解何时确实需要上报给更高级别的领导。

  5. 树立组织意识,让所有员工都有能力在结果面临风险时,从各个层级采取行动。为团队成员提供治理文件、权限级别、工具以及机会,让团队成员练习有效应对所需的技能。

  6. 为团队成员提供机会,练习应对各种决策所需的技能。一旦确定了决策级别,就应开展 GameDay 活动,确保所有参与人员都能理解并演示流程。

    1. 提供替代的安全环境,以便在其中对流程和程序进行测试和培训。

    2. 承认并让团队成员认识到,当结果达到预先定义的风险水平时,他们有权采取行动。

    3. 通过为团队成员所支持的工作负载和组件分配权限和访问权限,定义团队成员的行动权限。

  7. 让团队能够分享他们的经验教训(运营方面的成功和失败经验教训)。

  8. 授权团队挑战现状,并建立一些机制,让团队跟踪和衡量改进情况及其对组织的影响。

实施计划的工作量级别:

资源

相关最佳实践:

相关文档:

相关视频:

相关示例: