睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

从北京健康宝核酸天数算法调整说指标标准的严肃性

时间:2022-07-03来源:橘红浏览数:150

这里不是所健康宝的数据不够权威。而是内部对于数据权威性的认知还不够。系统上线需要走很多流程,但是为什么插入数据,并重新跑批计算核酸时长就可以快速执行?为了解决问题,插入一条临时记录是个啥意思?虽然这是为了解决问题,但是违背了数据真实性,会导致我等P民对数据权威性的挑战啊!

这两天我的彭友圈都被刷爆了。一个是网传某市数据泄露,23.88个T的个人及机密数据,有人在网上卖,10个比特币就行。一堆人在那里骂,还有人未雨绸缪,未来1、2年将会是电信诈骗的高发期。不过这个消息尚未确认,估计也没法确认,大家各自注意就好了。另一个事情是北京健康宝调整核酸检测时长的规则,导致影响一堆人出行,再次引发无数人骂娘。这可是非常典型的数据标准调整引发的灾难。

01事发

7月2日早上,我去加班。进门的时候门卫小哥好心提醒我:哥们,该做核酸了!我左思右想,总觉得这事不对头。于是我加班空余特意过去又扫了个码,截图留存了。我是6月29日做的核算,6月30日凌晨出的结果:

按照老逻辑,应该是这样的:6月30日是阴性0天;7月1日是阴性1天;7月2日是阴性2天。为啥7月2日变成阴性3天了?一看新闻才知道,北京健康宝的核酸时长计算逻辑发生调整了,对凌晨0-6时出具核酸检测结果的核酸检测天数计算规则进行了调整,由原来的当日显示为0天,调整为显示1天。也就是说:北京健康宝没有0天的逻辑了老彭的第一反应就是:肯定有一堆人遭殃了!如果是6月29日出的结果,原本7月2日应该是阴性3天,符合72小时出行阴性要求。但是按照新的规则,这些人就会被判定为阴性4天,不符合出行要求,无法出行了。这不乱套了么?

02应对

估计也是被逼的。北京火车站、机场接到大量反馈,于是紧急出台临时措施,让核酸阴性4天(原逻辑3天)的乘客正常出、返京,这才没出大事。另一方面,北京经信局也接到了大量的反对意见和强烈质疑,赶紧商量解决办法。到下午,老彭的健康宝又变了,从核酸阴性3天变回2天了。其实2号下午就变了,但我特意熬到3号凌晨截的图。就是想验证一下计算逻辑,以及他们的解决办法。其实这事他们用了一个很简单的办法解决的。他们没有把计算逻辑调整回去,而是把所有6月29日-7月2日凌晨出结果的核酸历史记录里,增加了一条数据:北京常驻+流动人口一直有红线,就是控制在2300万以内。所以只需要给2300万人中,核酸检测时间在6月29日-7月2日0-6点出结果的人加一条记录即可。从老彭个人检测时间的分布上来估计,应该大概有4-50%的概率(核酸检测机构真的很辛苦),也就是大约1000万左右。有人问了,为啥不把逻辑改回去呢?很简单,系统发布有非常严格的流程,需要测试多次才可以。另外,这次规则调整其实是深意的。北京防疫规则是72小时阴性证明。按照政策,应该是保证三天一检就行。但是会出现当天检测,第二天下午才出结果的情况。如果早上有会,那不就全完了么?所以如果有重要的事情,或者单位门卫看得严,我们大多都是两天一检。三天一检和两天一检看上去差不多,但是对于财政支出,就是非常恐怖的事情了!三天一检,一个月只需检10次即可,而两天一检就需要15次!增幅50%!按照2022年5月25日发布的《关于进一步降低新冠病毒核酸检测和抗原检测价格的通知》具体要求:

对于政府组织的大规模筛查、常态化检测,要充分考虑到规模效应和基层组织、志愿者对成本的分担效应,新冠病毒核酸多人混检按照不高于每人份3.5元的标准计费,检测机构仅提供样本转运及检测服务的,需进一步降低计费标准。

以及北京2021年年末人口2189万来算,三天一检,一个月需2189*3.5*10=7.6亿元,而两天一检一个月需2189*3.5*15=11.4亿元!一个规则就能节省3.8亿元/月!!!当然,老彭这么测算是不精准的,但是数量级是没问题的。数据标准怎么体现价值?这就是价值!但是有一说一,这事儿办的的确有问题。

03问题

那么问题在哪里呢?按老彭说,这事得办!而且必须办!越早越好!现在办都有些晚了!但是就目前出现的状况而言,肯定是出毛病了。我估计很多人还没明白其核心问题所在。老彭认为,这件事有以下核心问题:

1、标准的严肃性不足。标准的制定和更改是需要经过非常谨慎的研判的。最重要的是上下数据、业务依赖关系的研判。在这件事情上,北京健康宝核酸计算规则调整没有进行充分的研判,没有考虑到下游业务依赖关系,导致调整后严重影响市民出行。

2、数据的权威性不足。这里不是所健康宝的数据不够权威。而是内部对于数据权威性的认知还不够。系统上线需要走很多流程,但是为什么插入数据,并重新跑批计算核酸时长就可以快速执行?为了解决问题,插入一条临时记录是个啥意思?虽然这是为了解决问题,但是违背了数据真实性,会导致我等P民对数据权威性的挑战啊!

3、执行流程的缺位。我绝对相信北京经信局内部有非常严格的执行流程。但是北京健康宝不是内部系统,而是影响全社会的系统。绝对不能搞“政策突袭”,要提前发布公告,通知机场、火车站、高速等交管部门,告知民政部门做好对应措施,告知市民如何应对。然后在既定时间进行调整。是的,老彭我把执行流程放在最后了,把标准和数据放在前面。因为没有标准和数据的意识,就无法预判可能发生的问题,也就不会有完备的执行流程。数据理念普及长路漫漫,我辈还需持续努力!

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询