对话长征医院刘士远教授:数据库建设与医学影像AI的未来
2020年9月18-20日,由中国医学影像AI产学研用创新联盟(CAIERA)主办的第二届中国医学影像AI大会在上海国际会议中心盛大开幕。
作为本次大会的战略合作媒体,雷锋网进行了全程报道。
本届大会以“AI助力健康中国”为主题,吸引国内外数千名政、产、学、研、医及AI产业界代表参会。在第一天的开幕式上,中国医学影像AI产学研用创新联盟理事长、大会主席刘士远主任在现场重磅发布了《医学影像人工智能2020发展报告》,总结了2018年首届医学影像AI大会以来的最新行业变化与趋势。
作为医学影像AI的前瞻者,刘士远主任一直关注并积极推动AI产品的试用与反馈。《医学影像人工智能2020发展报告》中,共提及了行业的七大趋势。其中一点在于“整体解决方案平台化,提升临床使用效率”。
刘士远主任在接受雷锋网采访时,对这一要点作了进一步阐释:未来的趋势在于,是在信息化系统或者设备工作站系统中整合各类医疗AI应用,通过一个统一的入口来提升医生的工作效率,提升临床医生、影像医生的使用获得感。
当然,解决这个问题的核心,还在于医院领导和信息化部门的思维创新,即开不开放信息化系统的接口;以及如何辨别不同医疗AI产品的差异性。而第二点,这就回到了产品考核体系的问题——建立一些客观的行业标准。
标准,一直是医疗AI行业数年来一直讨论不断的话题。
围绕数据库建设和行业标准的问题,刘士远主任非常健谈:“现在行业缺少的就是标准,每个环节都是。虽然已经有企业拿到三类证,但是这仅仅是一个开端。进入临床以前,任何一个医疗产品都要有效果考核体系,要考核有效性、安全性、稳定性。”
在今年几款医疗AI产品获批的条件下,刘士远主任预判:在进入临床应用之前,医管局将会进一步加速评价体系的工作进度。
然而,从微观层面来看,肺结节、冠脉、脑肿瘤,这些不同病种的评价标准不一致,数据库建设的维度很多、难度很高。因此,完成这件事情需要依赖行业协会的核心专家,如果没有核心专家的参与,标准的制定很难符合实际情况。
除了监管和行业协会,从几年前起,不同的医疗AI公司也组织相关人力,对医学影像数据进行梳理、标注,形成了一个个的小数据库。但是,这样的数据库有若干问题:一、数据的采集、标注数据的质量如何界定?二、数据采集的合法、合规,是否存在“灰色地带”?
当然,这只是在数据采集阶段面临的一些难题。
除此之外,在产品的研发环节、验证环节、使用环节的标准都需要建立。这是因为,数据库系统建设是一项庞大的工程,需要逐步推进;其次,AI产品具有特殊性,本身的性能表现也具有波动性;再者,产品的敏感性和特异性是“一个跷跷板的两端”,评价AI产品的性能也是一个动态的过程。
所有的一切都在变化,这就需要数据库建设的参与者,做好“持久战”的准备,不断更新思维、更新方法。
刘士远主任表示,数据库建设是人工智能发展的一个核心问题。虽然人工智能的算法、算力在不断进步,但是数据永远是硬道理,数据库的建设是一件“非做不可”的事情。
“高质量标注的数据,一定是AI上下游所最需要的,也是政府监测、检测、评价所需要。”
基于这样的考虑,2018年,刘士远主任就曾牵头建设一个带有“示范性”和“实验性”的库,其中包含600多例放射影像数据。
他坦言,这个库只是基于CT的肺结节小样本影像数据,更多的是摸索、试验并掌握建库的方法、路径和标准。而今年启动的肺结节数据库建设,则是由卫健委相关部门主导,希望从数据模态、数据规模和数据维度上完全不同的数据库。
据雷锋网了解,目前卫健委放射影像数据库的第一个立项是肺结节数据库,未来冠脉、脑肿瘤、乳腺、肝脏都会单独立项。刘士远主任表示,未来形成的数据库将具备大样本、可挖掘、可拓展、多样性的特征,真正符合数据库建设的需求。
“数据库是国家战略资源,需要行业上下游贡献力量,尤其是掌握数据且具备制定标准和标注规则的细分行业医生,更有不可推卸的责任,最终建成后医生也会成为最终的受益者。比如放射影像数据库,需要全国的放射医生本着责任性和情怀,不仅要积极参与标准和标注规则的制定,也要积极参与贡献数据,一旦建成十多个亚专业方向的数据库,其战略价值不仅是人工智能的应用,还可以用于多中心科研、医生的继续教育以及人才培养;它的价值也不只是全国性的,更会是全球性的。”
以下为刘士远教授的大会演讲内容,雷锋网做了不改变原意的编辑和整理
刘士远:中国医学影像的发展,经历了十年的深耕,到现在为止发生了很大的变化。
宏观层面。在新基建的背景下,基于“5G+AI+数据中心”的建设,将会促进各个行业打破天花板。同时,国家科技部也鼓励所有的人工智能企业,与现实场景进行深度融合。
学术层面。中国的学术研究热度呈逐年上升的趋势,放射组学、深度学习、临床应用和大数据成为持续的热点、人工智能科研力度不断加码,理论积累与技术落地齐头并进、同时运转。
据《中国新一代人工智能发展报告2019》显示,我国AI论文发表量全球排名第一。特别是近五年来,医学影像AI的相关论文逐年增加,共发表文章6000余篇,中国以19.857%的占比仅次于美国的35.117%,位居世界第二,相关的研究领域集中在神经、胸部等方面。
技术层面,深度学习的方法不断取得突破:从深度神经网络,循环神经网络和卷积神经网络,再到生成对抗网络。
另外,图神经网络,基于其规则性和无序性的两大特点,能很好发现实体之间的依赖关系,可以在社交网络、推荐系统、金融风控、分子化学和知识图谱等领域产生巨大价值。
这也让图神经网络成为新的研究方向。
此外,还有计算和数据结合起来的新的算法和进展。大内存计算提升了数据处理性能,开始崭露头角,其工作原理是内存融合基础架构(MCI),将内存计算和数据存储合二为一,能大幅提升数据处理的整体性能,解决海量数据对IT的挑战。
目前,人工智能已从感知智能向认知智能方向发展和迈进。
在原来的感知智能阶段,深度学习要依赖海量标准标注数据,且中间过程不可解释。现在,以迁移学习、类脑学习为代表的认知智能研究热度在不断攀升,与传统深度学习不断融合,助推人工智能向认知智能过渡。
中国初创AI企业2012年开始增长, 2015-2017年快速增长,2018年达到顶峰。现阶段,初创的企业越来越少,由于疫情等诸多因素的影响,2020年前半年成立的AI企业是2019年全年数量的12%,人工智能的创业机会从窗口期开始迈入尾声阶段。
这表明,初创企业原始技术积累基本完成,重心将加速向场景洞察和方案落地转移。
以上情形都表明,通过前期的发展,我们的初创企业已经进入到落地或者是成熟的环节,而抗击疫情进一步促进人工智能多场景快速部署,获得正性反馈。
未来,随着人工智能逐步走向成熟,历经时间考验的AI企业,将真正释放AI的价值。
另一方面,资金现在进入到理性投资的阶段,总体上,AI私募投资趋于饱和。
数据显示,2019年仅为2018年的30%。今年1到4月,AI企业种子轮/天使轮的投资事件仅占2019年的34%,大家更加关注有成长性人工智能企业。
早期成立的AI企业在技术、产品、资本的助推下,落地场景和商业形态基本形成,发展路径逐渐清晰,高成长性逐渐形成。
同时,截止到2020年4月,人工智能企业里有十二家企业成功登陆科创板。科创板的创立,有效形成了私募市场和二级资本市场的衔接,让人工智能企业得以持续资金注入进行发展,释放创新活力。
在新基建方面,5G+云计算+AI深度融合,打开行业成长的新空间。
到2025年,我国预计建设5G基站500万到550万个。国务院发展研究中心发布的《中国云计算产业发展与应用白皮书》预测,到2023年,我国政府和企业上云率将超过60%。
5G负责对数据进行高效的传输,云计算的强大算力对数据进行存储、计算和服务,AI负责对数据进行分析和挖掘,5G+云+AI三者相互协同,将打破众多行业发展天花板。
在应用层面,疫情发展促进了人工智能企业的落地。今年受到疫情的影响,政策层面也加速出台了AI医学影像相关细则,AI影像辅助诊断的三类注册证陆续签发,院端对AI医学影像产品的合作意愿及要求均在提升。
现阶段,院端付费集中在三级医院,渗透率大概是4.5%-7%。随着产品价值不断被认可,医院付费意愿提升,2023年渗透率或达到15-20%。
AI类产品价值的体现将在基层实现最大化。然而,我国基层卫生人员水平有限,基层AI医疗产品的落地和规模化将是长期过程。
因此,对基层卫生人员进行相关培训,才能提升人工智能企业未来落地场景的泛化。
从统计数字来看,人工智能的初创企业有57家,加上传统的企业,共有100多家企业从事人工智能的研究,他们都有各自的领先优势,有三、四家企业已经获得认证。
其中,推想获得FDA认证,另外一些企业获得了欧盟以及日本的各种认证。这些认证将促进各种产品在国内以及国际市场上的落地和应用。
而AI在医学影像领域的应用,一是集中在临床工作流程的优化上,包括扫描、检查、图像处理以及扫描过程。
其次是围绕疾病诊疗的产品和应用,针对诊疗难度较大的胸部、神经、冠脉疾病等的AI产品将会越来越多,而且使用的场景也越来越接近真实需求。
比如,医院对肺结节AI模型的使用。长征医院在2017年的利用率还是在60%左右,2019年达到70%。今年疫情结束后,点击率基本持续保持在80%以上。这些数字表示,临床医生欢迎且愿意使用好的产品、解决问题的产品。
未来,医学影像AI产品的趋势将是以患者路径为核心,融合多模态的数据和先进的算法技术,覆盖全流程的决策环节。
具体分为以下七个方面的趋势:
产品发展趋势之一:产品领域和种类、病种向产品多样化扩散,病种从胸部、神经拓展到各个身体部位。
据亿欧智库不完全统计,截止到2019年5月,全国57家AI医学影像公司中,以影像诊断为主要业务的已占到77.1%。
产品发展趋势之二:产品功能垂直度加深。
从检出、分割、量化、分类、诊断、疗效评估到治疗决策,包括结构化输出,能提供一站式多维度的信息。
比如冠脉CTA智能诊断系统,不仅可以做影像后处理,还可以写初步报告、复审和打印,每个环节都可以很好地解决临床的痛点。
产品发展趋势之三:单任务模型向单部位多任务模型发展。
单部位多病种检出,更加接近医生的日常临床工作模式,大幅提升了医疗的效率、准确性和标准化。
产品发展趋势之四:软硬件一体化是人工智能技术落地的必然发展方向。
一方面,AI算法与硬件融合不仅突破硬件物理局限,提升智能密度(单位面积算力)。同时,增加软件使用临床感受,改善软件功能,促进落地。
产品发展趋势之五:AI嵌入全流程,助力打造诊疗闭环。
AI医学影像辅助诊断结合AI导诊、AI预问诊和AI预后康复等功能应用,向着医疗完整流程应用发展。
产品发展趋势之六:整体解决方案平台化,提升临床使用效率。
平台化使得很多产品在医院和科室的平台上有一个统一的入口,使用方便且减少无效的操作,提升临床工作的获得感,使用的便捷性是未来传统设备厂商、信息化厂商需要进行投入和考虑的事情。
产品发展趋势之七:云端部署,拓宽医疗边界,落地分级诊疗。基于AI新基建的方法,促进线上线下一体化发展,加快基层落地。
未来,我们需要建成一站式放射科全流程人工智能使用平台。现阶段的痛点是AI厂商多,服务器及产品存在孤岛效应,结果展现也不规范,流程集成度低。
此外,结构化报告使用不足且不统一、不规范,各医院模板有差异,缺乏标准。希望今后有经过认证的AI产品进入临床,通过结构化报告给临床提供更多信息,形成放射科AI的绿色生态工作环境。
现今,医学影像AI的发展依然面临多方挑战。
在产品层面,需要更多符合临床使用场景的产品,以及配合各产品的检测库;
监管层面,需要对产品定义和分级,制定临床验证规范的方法;
商业层面,产品分类、分级、定价以及付费主体都是需要考量的因素;
安全层面,数据亟待规范,包括数据的安全性、合法性,符合伦理要求;
医院层面,AI产品要符合医疗的准入规则、需要建立临床评测标准和体系。
需要重点指出的是,相关上下游的专家,编写了《中国医学影像人工智能发展报告》,其中,包括了术语、数据、算法、算法热点、质量与控制、产品临床验证、产品监管临床应用现状、产业化现状、教育需求,以及伦理要求等。
现阶段,人工智能增长是第一位的,未来无论地位是否下降,但是人工智能的决策、诊断、用于院前院后服务的全流程一定会成为未来趋势。
今年是监管部门集中发三类证的一年,明年将有更多人工智能企业落地到临床使用,相关行业协会要配合政府部门来做进入临床环节的AI评价体系,也是需要提上议事日程的关键一年。
作为行业协会和相关的部门,我们也愿意一起制定相关的进入临床的有效性、安全性、风险伦理等等的工作。
目前,AI只能解决部分问题,临床工作主体依然是医生,但AI已经显露出作为医疗助理的强大潜力。隋着技术的不断进步,未来的发展趋势一定是人机融合、交互,发挥更大作用。
这就需要政、产、学、研、用各个方面共同努力,打破相互之间的壁垒,实现各方环节的突破,才能推动整个产品和行业的发展。