抗击疫情的关键是切断传染,这中间,各地最困扰的问题就是网民反复讲的“如何找到‘B’类人群”。这些与感染人群或来自疫情重大地区人群(被称为A类人群)在未知公共场所产生过某种交集的人,需要尽快采取隔离措施。

找到B类人群常规的做法有两种:一是询问“A”类,通过他们的陈述来寻找。这种方式不仅时间长效率低,而且可能因为记忆疏漏或者故意隐瞒而导致严重遗漏。另一种是公布病例的轨迹,让公众自行查找自己是否有可能成为密切接触者。这种方法也无法保证效果,毕竟有人不会查,查了即使是密接者,也会有人不主动申请隔离,从而留下巨大的传染隐患。

在常规方法存有隐患,疫情又十万火急的情况下,许多大数据建设比较完善的城市和地区,不约而同地选择了大数据分析作为找到“B”类人群的核心工具。原因很简单,所有的“B”都是因为与“A”有时空上的交叉才出现的,而这些交叉,当汇集到越来越多的城市管理数据时,就表现为数据的交集。比如,交通部门数据中出现在同一个航班、同一个高铁车厢的乘客、或者是医疗系统中登记的统一时段内就诊者、在药店购买发烧药的来自重点疫情地区的人…

“通过智慧城市大数据已有的数据,再接入公安、民政局、住建部、社保、卫健委等信息,通过数据分析模型,我们能在半小时里,帮助相关疫情分析人员计算出相关疑似病人名单,并推送给一线防疫人员。相比之下,没有这套系统的地方,仅依靠人工用Excel拉数据计算,可能就需要2-3天时间。”北京海致网聚信息技术有限公司(下称“海致”)总裁杨娟在接受澎湃新闻专访时称。

自1月21日开始,海致协助各地相关部门通过海致的大数据挖掘系统,每天处理相关数据几十亿条,每天发出几万条关于“B类人群”的信息,为社区工作者的精准排查提供支撑。海致成立于2013年,专注于智慧城市、安防和智能金融等大数据分析领域。目前已与80多个地市展开了大数据应用的深度合作。

用大数据分析快速找到“B”

既然“B”类人群是因为与“A”类人群有时空交叉才出现的,那么就需要确定A和B是在哪个地点、哪个时间段、做了什么。也就是我们写作文时,所需要的人、地、事、物。

在发生疫情前,多地城市的大数据建设,已经汇聚了海量的人口、铁路航班、城市交通等数据,这些数据成为了寻找“B”类人群的大数据基础。只要将卫生部门的“A”类人群数据接入,再对接一部分卫生、基层社区组织的数据和互联网数据,通过大数据分析和计算,就能高效地找到B类人群画像。

据杨娟介绍,包括武汉在内,这次很多城市抗击疫情的大数据分析挖掘都以海致数据中台以及知识图谱为重要依托。在这个中台里,除了有基础的城市大数据外,还能对接城市卫健、交通、基层社区组织数据。

“在我们这个平台里,我们大概融合了上百类数据,疫情出来后,我们迅速搭建了66种,2000多个模型,涉及到关注人员、交通管理、隔离监管、医疗收治、舆情分析、治安警情、返程复工等一系列围绕抗击疫情社会面的态势感知模型。这么多的数据经过分析和计算,定期刷新,然后推送到一线防疫工作人员手中。同时,我们设置了一个自动反馈和修正的机制,这个平台会根据外界的反馈和输入,不断优化模型,让数据推送的精准程度不断上升。”杨娟说。

举个例子,在多地迎来复工复产潮后,一旦有人(也就是“A”)被确诊。这套系统能马上派上用场。首先,可以通过城市大数据中的人口数据,找到这位家庭成员,然后通过社保数据,找到就业单位;再通过交通数据,查找搭乘同一班飞机或同一趟高铁的同行者;通过这样的多维度的筛查,这套系统能在30分钟内计算出与A有密切接触的人员,并把分析结果分发到一线防疫人员手中。

这样一来,可以快速批量找到“B”类人群的相关身份信息,不仅提高了疫情防控效率,也减少了人为的瞒报、漏报的情况。

大数据还能做些什么

据杨娟介绍,目前,全国许多地方已经基本形成了以“人口、房屋、行业场所、交通、互联网”等数据为主,以“金融、民政、教育、医疗、工商、税务、市政、能源”等政府部门共享数据为辅的完整数据体系。在应用层面,也基本实现了基于物联感知、地理信息、大数据和人工智能技术的“综合态势感知、对象监测预警、群体关系挖掘、互联网舆情监测”等实战应用手段。

在疫情出现前,多地的城市大数据就已经在其他多个领域里发挥作用。“比如公共安全事件、重大生产事故、自然灾害,以及金融群体性事件等。”杨娟说。

例如:在金融事件中,一旦有人主动举报,触发某人或者某个公司可能存在非法集资,或者吸纳大额公众存款等情况。相关部门就能根据举报,拉通各类数据来做关联分析。

“利用人口信息、经济活动数据、税务数据、社保数据,可以做关联分析,来看这家公司是不是已经构成了非法集资的情况,数据分析可以做个预判。”杨娟告诉澎湃新闻。

而利用大数据分析结果,去抓捕逃犯,寻找潜在恐怖分子的案例,已经不算新鲜。尤其是在互联网、大数据、人脸识别等技术的联合助力下,国内警方曾陆续破获几年前、十几年前,甚至是几十年前的众多悬疑案件,例如近期轰动一时的劳荣枝案件。

疫情下,大数据应用带来的三点思考

既然依托城市大数据建立的数据分析能力如此有效,未来是不是可以建立一种预警模型,一旦数据在某些领域里发生了变化,系统就能自动报警,从而起到公共卫生应急事件的作用?

“如果我们能够把数据更好的利用起来,至少能让我们相关部门在进行一个决策和判断的时候,能够做到有据可依,而不是完全凭经验和直觉。但是最终的决策并不是由数据来做出的,数据只是一个辅助决策的作用。”杨娟说。

通过这次的疫情,杨娟认为,未来公安大数据想在公共卫生应急体系里发挥更好作用,可从以下几个方面着手。

首先,从政府角度来说,应进一步整合城市各部门各渠道的数据,建设城市公共卫生应急大数据体系。“现在各个部分数据割裂,各自归各自的情况是在改善的,比如说在很多疫情紧急的城市,其实是在比较短的时间之内,平台上就接入了像卫建委,交通和出行的数据。这次是突发事件,有点特事特办,但未来我们希望数据能变成一个常态化的拉通。”杨娟说。另外,数据如何运转,各个部门之间如何配合流程、完善,也需要建立相应的规章制度,把整个流程制度常态化。

其次,从大数据技术公司的角度来说,杨娟认为,除了要在平台技术层面上有更大的突破外,我们还需要去贴近政府的具体应用场景,确保数据分析模型能够快速支撑业务需要。

第三,建设围绕城市管理、公共安全和公共应急体系中数据采集和使用的法律体系迫在眉睫。

杨娟告诉澎湃新闻,公共危机事件发生时,公民应该义务提供哪些数据?城市各部门应该开放哪些数据?相关部门在使用这些数据时的权利和责任、时间期限和条件是什么?这些都是在此次疫情中出现的界定不清晰的区域,直接关系到疫情的准确排查、社会的公共舆论和民众的参与配合。因此,围绕公共安全的数据法律体系建设,应该也是未来公共应急体系的一块基石。

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)