9. 治理 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

9. 治理

机器学习治理包括一组有助于部署机器学习模型的流程和框架。它包括模型的可解释性、可审计性、可追溯性以及成功 end-to-end机器学习生命周期的其他更抽象但必不可少的要求。

9.1 数据质量和合规性

机器学习系统考虑了个人识别信息 (PII) 的注意事项,包括匿名化。它记录并审查了列级谱系,以了解数据的来源、质量和适当性。它还具有针对异常情况的自动数据质量检查功能。

9.2 审计和记录

机器学习系统具有开发过程中所有变化的完整日志,包括运行的实验以及为遵守监管而做出选择的原因。

9.3 可重复性和可追溯性

机器学习系统包括完整的数据快照,用于精确而快速地重新实例化模型,或者它能够重新创建环境并使用数据样本进行再训练。

9.4 签收 Human-in-the-loop

机器学习系统具有手动验证和授权功能,可确保合规性。系统要求每一次环境移动(例如,开发、QA、Pre-Prod 和 Prod)都需要签字。

9.5 偏见和对抗攻击测试

机器学习系统使用多种工具和攻击向量进行红队对抗测试,并对特定亚群进行自动偏见检查。该组件与 “可观测性和模型管理” 部分相关联。