当心DevOps虚假指标

昨天的文章分享了LinkedIn如何从0到1建立SRE文化——《好奇!LinkedIn的SRE文化是如何炼成的》,而指标也是建立技术文化的一种,相信很多DevOps团队的Leader都有同样的苦恼,今天数人云带来的文章将讲述如何制定有效的DevOps指标,告别虚假指标。

有了这些理念的指导,我们还有落地实践等着大家一起来交流讨论—— 6月10日活动《DevOps&SRE超越传统运维之道》邀请到了邱戈川@数人云、黄星玲@优维科技、任发科@常新居士、王一男@百度齐聚分享,点击“阅读原文”即可报名。

改变指标=改变文化

DevOps负责人往往纠结于指标问题,因为改变的指标同时也在改变业务文化,这种改变横跨不同的功能领域,如开发、测试、运维等部门。所以不成熟的指标常常会导致产品性能大打折扣,而传统指标又不完全适用于当前的大环境。

传统指标三缺陷

〓 虚荣指标

虚荣指标贯穿于整个代码产出线和构建功能点的过程,程序员独立行动而不进行跨部门的团队协作。因此,若奖励机制和虚荣指标相连,程序员只顾自身任务而忽略了需要团队协作的内容,如重构和简化设计等。

〓 引起团队冲的指标

代码共享、指导和建议都是团队协作的良好习惯,但一些机制是破坏这种习惯的罪魁祸首。如名次机制。其他领域名次机制可能有效,但在运维团队中名次机制会导致对外来部署和变化的排斥。同时也与DevOps的初衷不符。

〓 传统指标

许多DevOps负责人坚持用平均故障时间(MTBF)和全时工作当量(FTEs)来度量指标。但在如今快速交付模式下已经不再适用。

有效的DevOps指标参考

〓 指标可触及

不可触及的指标毫无意义,所以需要DevOps工具来帮助获取所需指标,当然通过间接监测也可以体现所需指标。如看员工留任率要比看员工工作状态更容易可靠。

〓 指标可推敲

作为DevOps负责人,要制定任何指标都必须能经得起反复推敲。因为负责人的信誉取决于沟通能力、团队价值观和使命感。

〓 指标独立性

能被任何一个人,团队或整体影响的指标都不是好指标,因为团队效益与服务等级协议密切相关。减少指标的关联性,以防止指标被利益关联者利用,造成损失。

〓 指标有能动性

有用的指标能够在工作流程中引导DevOps负责人作出最佳决策——奖励机制、团队策略、成员培训、使用工具和其他控制方面的转变策略。虽然并不是每一个决定都能产生质变,但在潜移默化中也会影响团队的建设。

原文链接:https://devops.com/beware-false-devops-metrics/#disqus_thread

原文作者:ARUNA RAVICHANDRAN