疫情可视化,基于知识图谱的智能疫情监测服务平台如何做?

  3月2日,中国电子技术标准化研究院联合PlantData等20余家单位及时总结和宣传推广一批知识图谱领域的好经验好做法,共同发布了《知识图谱助力疫情防控和复工复产案例集》(第一期),旨在推进疫情科学防控与企业有序复工复产。PlantData《基于知识图谱的智能疫情监测服务平台》案例入选。

  基于知识图谱的智能疫情监测服务平台

  1 案例背景

  新冠肺炎疫情形势不断变化,在防治工作中,基于知识图谱的智能疫情监测服务平台能够利用全面、有效,及时的数据和可视化技术准确感知疫情态势和防控措施落实情况,为决策者、指挥者、管理人员提供数据服务;通过确诊病例的亲属关系、工作关系以及生活轨迹,从中提取有效信息,找出其密切接触者进行隔离观察,对于潜在感染者挖掘将提供有力的支持;针对疫情数据获取,实时高效自动解答关于疫情常见问题,帮助广大人民群众及时获取防控疫情工作动态,了解和掌握新冠肺炎疫情的防控信息和手段。

  2 案例技术框架

  如图所示,本平台基于知识图谱生命周期活动要素,通过多策略抽取机制对疫情数据进行抽取、映射、转换,形成疫情知识图谱,实现医疗、百科、新闻、公告等多源数据汇聚,并提供各类可视化、统计、问答应用。

  3 难点与挑战

  疫情数据以非结构化文本信息为主,数据源主要是卫健委、各省市部门、各权威媒体发布的公告、新闻、政策等,一方面从这些文本中提取有效信息,另一方面基于结构化的信息构建面向用户的问答助手。具体分析如下:

  面向疫情新闻、公告、政策等文本数据抽取

  文本数据抽取的主要难点在于需要针对大规模语料分析文本中的词法、句法、语法等维度信息抽取特征,从而进行抽取模型的训练。同时为了保证构建图谱的准确性,需要进行多轮的模型调优工作。对于此次疫情,主要的文本数据包括各省市通报的通知公告、热点事件新闻、病毒百科介绍等,其面向的领域不同,结构各异,长短不一,因此需要针对不同的目标文本设计对应的抽取方案。面向防疫措施、疫情统计、病毒百科等问答技术

  本次疫情中主要涉及针对病毒、防治、事态发展等主要场景的各类问答。针对用户输入的疫情相关自然语言问题,对其中的关键元素(概念、实体、属性、各类运算符等)的识别,结合子图匹配方法转化为计算机可理解的查询意图,从而获得答案。难点在于不同用户的用词、用句和表述方式均不相同,需要结合知识图谱、深度学习、迁移学习等AI技术,实现用户意图的精准识别。

  4 案例成效

  运用病毒百科、临床、“新冠英雄”、疫情病例等多维度知识图谱,面向企业、政府、普通民众等多类角色提供实时监测、统计分析、智能问答等服务,主要包括:

  面向政府、企业、民众提供区域疫情可视化分析。可对医院、城市、省份的确诊、疑似、死亡、接触人数等关键指标和趋势分布进行实时统计,进而对疫情状态进行实时监测并提供辅助决策。

  面向政府提供区域病患关联图谱应用。本案例涵盖了超级传播者挖掘、关键点发现、家庭聚集性传播分析、城市区域风险等级分析等图谱分析应用。此外,系统可收集和管理区域病患信息,帮助快速进行潜在感染者的排查和检测,最大限度避免高风险人员流动导致的交叉感染。

  超级传播者挖掘家庭聚集性传播分析

  面向普通民众提供疫情问问服务。针对用户输入的各类疫情问题,进行基于知识图谱的自然语义理解,并为用户提供实时解答疫情防护基础信息、疫情统计信息、发热门诊机构、新冠病毒的症状及就医指导等。同时,普及防控知识,对新冠常见症状指引咨询,并提供便捷的就诊信息。

  面向企业。结合企业内部员工出行、住宿、高危小区、已确诊病例及轨迹等多维数据,形成企业疫情监测平台,提供高危预警服务,指导企业有序复工。

  5 案例意义

  工信部在2月4日发布《充分发挥人工智能赋能效用 协力抗击新型冠状病毒感染的肺炎疫情倡议书》,倡议组织科研和生产力量,把加快有效支撑疫情防控的相关产品攻关和应用作为优先工作。

  面对疫情的快速传播,PlantData积极响应国家和社会需求,研发出用于全国相关政府部门开展工作的基于知识图谱的智能疫情检测及应用方案,分析其传染关系及接触关系非常有利于疫情的防控,对疫后的研究分析可提供强有力的支持。

  前往【PlantData知识图谱】百家号主页,查看更多案例。

  AI 是新的生产力,知识图谱是 AI 进步的阶梯。

  PlantData 基于识图谱的认知智能中台帮助企业把多源异构数据转化为知识,提供知识图谱全生命周期解决方案,打造行业智能大脑,助力企业智能化转型。

  举报/反馈