由德国飞机涡轮机的发明者帕布斯·海恩提出“海恩法则”(Ohain’s law),现在已被广泛应用到企业的安全生产管理中。
这一法则指出,每一起严重事故的背后,必然有29次轻微事故和300起未遂先兆以及1000起事故隐患。
因此,海恩法则强调两点:一是事故的发生是量的积累的结果;二是再好的技术,再完美的规章,在实际操作层面,也无法取代人自身的素质和责任心。
对于任何一家第三方支付公司来说,运行保障工作都是重中之重,关系着用户财产安全和使用体验的好坏。
作为国内首家在香港上市的第三方支付公司,汇付天下是如何做到及时发现并控制事故征兆的呢?
近期,小钛走近了荣获“钛客Play 2019”科技创新一等奖的统一监控告警平台——透镜(以下简称“透镜”),详细了解这一项目的设计开发及应用落地情况。
透镜项目组里大多数都是90后,就是这么一群年轻钛客们,开发出了统一监控告警平台——透镜,成功实现了一站式运维监控,海量日志分析、聚合智能报警等强大功能。
据了解,透镜项目自2018年8月正式启动,历经近一个月的艰苦奋战,最终在当月成功上线,深入应用到支付风控的方方面面。
项目人员介绍,以前我们的报警处置流程主要是人工结合系统监测,需要由值班人员发起,运维人员初步判断问题后,再电联相关人员,等到进入到处置流程,可能已经过了半小时之久。
而运用透镜后,报警处置流程主推钉钉响应机制,开发、架构、主机、网络、DB等各类人员在收到报警的第一时间,可以同时进行排查工作,更快判断问题原因,从而也能够更快进行问题处理,并尽快恢复服务的正常运行,有效地将事故征兆和事故苗头扼杀在摇篮里。
一位负责风控合规监控的软工表示,“应用透镜后,我们的监测效率大大提升,终于可以睡得安稳、吃嘛嘛香了。”
作为一项公共基础服务,透镜目前已接入汇付近百余个业务系统,为它们提供一站式运维监控,对海量日志进行分析,并建立起了聚合智能报警机制。庞大的数据量支撑着这个统一监控告警平台,如同一面透镜一样。
据悉,目前透镜还在不断进行维护优化,同时也在试图接入更多的业务系统之中。让汇付天下的一切线上问题无所遁形,就是透镜的终极目标!