评估具体改进
了解您的工作负载为完成一个工作单元而预置的资源。评估潜在的改进,并估计其潜在影响、实施成本和相关风险。
要衡量一段时间内的改进情况,首先要了解您在 AWS 中预置了哪些资源,以及这些资源的使用情况。
从全面了解您的 AWS 使用情况开始,并使用 AWS 成本和使用情况报告来帮助识别热点。使用此
AWS 示例代码
代理指标
在评估具体变更时,您还必须评估哪些指标最能量化该变更对关联资源的影响。这些指标称为 代理指标。选择最能反映您正在评估的改进类型的代理指标,以及改进所针对的资源。这些指标可能会随着时间的推移而变化。
为支持您的工作负载而预置的资源包括计算、存储和网络资源。使用代理指标评估预置的资源,以了解这些资源的使用情况。
使用代理指标来衡量为实现业务成果而预置的资源。
资源 | 代理指标示例 | 改进目标 |
---|---|---|
计算 | vCPU 分钟数 | 最大限度地利用预置资源 |
存储 | 预置容量(GB) | 减少预置总量 |
网络 | 传输的流量(GB)或传输的数据包数 | 减少传输总量和传输距离 |
业务指标
选择业务指标来量化业务成果的实现情况。业务指标应反映工作负载提供的价值,例如,同时活跃的用户数、处理的 API 调用数量或完成的事务数。这些指标可能会随着时间的推移而变化。在评估基于财务的业务指标时要谨慎,因为交易价值的不一致会使比较无效。
关键性能指标
使用以下公式,将预置资源除以实现的业务成果,以确定每个工作单元的预置资源。
![显示此公式的图表:每个工作单元的预置资源 = 预置资源的代理指标/成果的业务指标](images/key-performance-indicators-formula.png)
KPI 公式
将每个工作单元的资源用作您的 KPI。基于预置的资源建立基线,作为比较的基础。
资源 | KPI 示例 | 改进目标 |
---|---|---|
计算 | 每个事务的 vCPU 分钟数 | 最大限度地利用预置资源 |
存储 | 每个事务的 GB | 减少预置总量 |
网络 | 每个事务传输的数据量(GB)或每个事务传输的数据包数 | 减少传输总量和传输距离 |
估算改进
估算改进,即减少的预置资源数量(如代理指标所示)和相对于每个工作单元的预置资源基线的变化百分比。
资源 | KPI 示例 | 改进目标 |
---|---|---|
计算 | 每个事务的 vCPU 分钟数减少百分比 | 实现利用率最大化 |
存储 | 每个事务数据量(GB)减少百分比 | 减少预置总量 |
网络 | 每个事务传输的数据量(GB)减少百分比或每个事务传输的数据包数减少百分比 | 减少传输总量和传输距离 |
评估改进
根据预期的净收益评估潜在的改进。评估实施和维护的时间、成本和工作量级别,以及意外影响等业务风险。
有针对性的改进通常意味着在所消耗资源类型之间进行权衡。例如,为了减少计算消耗,您可以存储结果,或者为了限制传输的数据,您可以在将结果发送到客户端之前处理数据。稍后将详细讨论这些 权衡 。
在评估工作负载的风险时包括非功能性要求,包括安全性、可靠性、性能效率、成本优化以及改进对工作负载运行能力的影响。
将此步骤应用于 示例场景,您使用以下结果评估目标改进:
最佳实践 | 有针对性的改进 | 潜在 | 成本 | 风险 |
---|---|---|---|---|
使用最少的硬件来满足您的需求 | 实施预测性扩展以减少低利用率时段 | 中 | 低 | 低 |
使用最能支持您的数据访问和存储模式的技术 | 实施更有效的压缩机制以减少总存储量和实现时间 | 高 | 低 | 低 |
实施预测性调度可减少未充分利用或未使用的实例所消耗的 vCPU 小时数,相比现有扩展机制可提供适度的效益,估计可减少 11% 的资源消耗。所涉及的成本很低,包括云资源的配置和 Amazon EC2 Auto Scaling 的预测性扩展操作。当响应超出预测的需求而被动地执行横向扩展时,风险是性能会受限。
实施更有效的压缩将产生重大影响,大幅减少所有原始图像和经过处理的图像的文件大小,估计生产中的存储需求减少 25%。实施新算法是一种低工作量的替换方案,涉及的风险很小。