【各抒己见】大家对人工智能医疗怎么看?人工智能医疗应该着重往那个方向发展比较好?

  例如骨折打骨钉,中国最好的三甲医院的医生,都会存在10%的失误率,二三线城市更严重。我们投资的这个手术机器人,可以帮助医生很快找到最正确的定位,精度误差少于0.1微米,帮助医生进行高精度的手术。这个需求在三甲医院很大,但是能想到这样的模式,还是依赖于对于行业本身的深入了解。

  人工智能领域创业,第一批出来的一定是最顶尖的研究深度学习的科学家和大牛。但是科学家和大牛最容易碰到的问题就是对于行业没有那么深入的了解,而且往往觉得深度学习就是个锤子,满世界都可以钉。只有当他们对产业和应用场景有深入了解之后,才有可能成功。

  

  张少典

  森亿智能 创始人

  医疗人工智能主要不是个技术问题。比如,用深度学习搞医疗图像的诊断、评估,在很多点上都已经开花了。例如:

  就是用深度学习读乳腺癌病理切片图像,比病理学家判断的更准。类似这样的场景,在研究领域已经数不胜数。

  甚至其实根本用不到深度学习。医疗AI最接近商用化的例子其实是大家跟本想不到的厂商做出来的。既不是GOOGLE这样AI功底雄厚的公司,也不是医疗软件公司。而是西门子和NEC这种传统医疗大型器械厂商。在日本,病理读片大多都需要两名医生共同完成以防止错漏,而NEC很多年前的自动读片系统就在大量的日本医院里开始应用,在很多疾病下已经做到了取代其中一名医生的角色。

  医疗AI既然主要不是个技术问题,我认为就不宜过分炒作和夸大深度学习等概念在医疗上的效果。

  医疗AI真正的问题是三个:

  1. 无缝嵌入临床诊疗流程。临床是一个超级庞大的系统工程,而每个新组件的加入都可能会破坏既有的规范,打造出新的操作规范。但由于安全性是医疗的第一要素,新的规范和流程必须要在反复验证之后才可以被实施。而机器往往达不到这样的系统鲁棒性,也无法做到与既有人工流程的完美耦合。

  2. 法律和伦理问题。除非机器能做到100%准确,否则这两个就是完全绕不过去的超级阻碍。

  3. (中国特色)买方问题,也就是商业模式问题。国内做医疗大数据、医疗AI的,普遍还饿着肚子,就是因为产业下游缺少了成熟的商业医保和药企作为最终的买方。没有商业医保的强烈控费诉求,以及药企的强烈研发需求,数据的作用会大为减弱。中国的商业医保和药企,基本只有一个诉求:卖!卖的出去就行,卖的越多越好,至于准不准、精不精、科学不科学,不是他们现在关心的问题。而数据和AI的威力就在于后者。

  

  吴正芳

  云上视觉智能实践者

  现阶段,很多用于医疗的人工智能算法还在探索之中。阿里云ET医疗大脑在精准医疗、医学影像、药效挖掘、新药研发、健康管理、可穿戴设备等领域进行了一系列探索,并已在肺癌、宫颈癌、甲状腺癌等领域实现突破。下面以肺结节检测为例,介绍ET大脑所做的工作。

  为什么做肺结节检测?

  据国家癌症中心公布数字显示,中国2013年恶性肿瘤发病率为270.59/10万,死亡率为163.83/10万,而肺癌在所有恶性肿瘤发病及死亡中均占首位——我国每年约59.1万人死于肺癌。

  而肺癌生存率与首次确诊时的疾病阶段高度相关:由于早期肺癌多无明显症状,导致肺癌临床确诊时往往已达中晚期,治疗费用高但效果不佳。因此,对肺癌的早期检测和早期诊断就显得尤为重要。

  胸部CT放射影像技术,是肺癌早期筛查的有效手段。但是由于CT扫描影像数量多(一次CT扫描影像通常在200张以上),医生诊断所需时间长,加上工作量巨大,容易疲劳,人工误差不可避免;当前,大数据与人工智能等前沿技术在医疗领域应用已经成为一种趋势,将大数据驱动的人工智能应用于肺癌早期诊断中,不仅可以挽救无数患者的生命,而且对于缓解医疗资源和医患矛盾也有重大意义——人工智能成为新的选择。

  ET大脑如何做肺结节检测?

  算法主要包含下面三个基本步骤:

  数据准备——大量经过影像科医生标注的肺结节CT影像图片来训练算法,标注出可疑位置,大小,良恶性以及可能的预后情况,影像图片背后的患者基础信息,例如性别,年龄,基础疾病,家族史,吸烟史等也能用于提高算法的能力。

  智能算法——使用大量经过影像科医生标注的CT影像图片训练肺结节检测模型,通过深度学习算法学习肺结节的内在特性,经过肺部区域提取、肺结节分割和肺结节分类等步骤,系统自动给出肺结节的位置,大小和置信度。

  数据应用——该辅助诊断模块应用于院内PACS系统,医生工作站,Dicom阅读器等,实时为医生诊断提供智能辅助,同时根据该患者在院内后续的检查/治疗(例如病理切片结果,手术预后等)结果,不断自我纠正,备注,以及学习,以积累更多的“经验”。

  从肿瘤的发生规律来看,原发的肿瘤以单个多见,所以多发的结节恶性的风险比单个的结节要小,但这并不代表就没有恶性的概率。事实上,通过X光胸片基本发现不了早期肺癌,目前对肺癌最精准的筛查方法是低剂量高分辨螺旋CT。

  肺结节检测,就是利用大数据驱动的人工智能于肺癌早期诊断中,让计算机自动、快速、准确的从病人肺部CT扫描序列中发现疑似结节位置和估计肺结节大小,提高检测速度和检测的准确率,以降低肺癌早期筛查的成本,从而挽救更多患者的生命。

  算法上遇到的挑战及突破

  然而,基于人工智能的肺结节检测方法,存在一些列的挑战:结节模态多,早期的结节小(小于10mm),跟周围血管组织区别小,传统手动特征+机器学习的方法和用于自然图像的深度学习网络通常难以凑效。

  后来,有学者把深度学习算法应用到肺结节检测算法中,检测性能获得了明显提升。这类算法通常分为两步:

  先通过分割或检测模型生成包含大量假阳性结果的候选集;

  再通过分类的方法降低假阳性率。

  但是这类两步算法训练过程超参数多,训练繁琐。iDST-VC团队创新性地采用了单步流程:使用单个深度神经网络对病人的CT序列进行处理,直接输出检测到的肺结节位置和大小。

  相比与两步流程,单步流程有三个优点:

  首先,单步流程的整个模型可以实现端到端的训练,更加符合现代深度学习的思想,从而效果更优;

  其次,基于单步流程的系统更加简单快速,无论是模型的训练还是预测,速度都要远远快于基于两步流程的方法;

  第三,单步流程涉及到超参数更少,系统更加鲁棒,对样本的适应性更强。

  具体到模型结构设计上:针对CT切片特性,采用多通道、异构三维卷积融合算法、有效地利用多异构模型的互补性来处理和检测在不同形态上的肺结节CT序列;同时使用了带有反卷积结构的网络,提高对不同尺度肺结节的敏感性。最后还采用了多任务学习的训练策略,模型组合等策略,最终提高了检测的准确度和效率。

  LUNA16比赛冠军

  LUNA16比赛是国际上权威的肺结节检测比赛,大赛要求我们对888份肺部CT样本进行分析,寻找其中的肺结节。我们最终克服了结节模态复杂,早期的结节小等问题,最终,ET医疗大脑在7个不同误报率下发现的肺结节平均召回率达到89.7%,在2017年7月13日获得第一名。

  但是LUNA16比赛的CT影像层厚都不超过2.5mm,而现实场景中5mm和10mm层厚的CT影像大量存在,对技术提出了更大的挑战。我们还在继续优化CT肺结节智能检测引擎,进行算法创新,让肺结节检测技术能更好的用于实际场景中。

  

  丁香园

  正式开始讨论前,有必要先界定清楚讨论对象。

  人工智能(Artificial Intelligence,AI)其实分三类:

  ·弱人工智能(Artificial Narrow Intelligence,ANI)(简称绝不是「弱智」):擅长于某一方面的人工智能,比如大名鼎鼎的阿尔法围棋(AlphaGo);

  ·强人工智能(Artificial GeneralIntelligence ,AGI):在各方面相当于人类;

  ·超人工智能(Artificial SuperIntelligence ,ASI):各方面都比人类强。

  后面两类没举例,是因为还不存在,不过相关幻想,已从《星球大战》延续到《西部世界》,直接拉高了我们对 AI 的期待与恐惧。

  而回归现实,目前被热炒、被关注、被讨论、被质疑的 AI,其实都还属于「弱人工智能」范畴。

  具体到医学领域,弱人工智能目前在诊断硬件、数据采集、辅助诊断、监测反馈、教学培训、精准医疗等方面,都已有所尝试了。

  谈及人工智能医疗,我们可能先要承认,我们在此还是比较落后的。

  例子一:

  Nature 报道了 AI 利用深度学习的图片识别技术,在皮肤癌领域的进展。

  这是一场比赛。

  比赛双方,一边是利用「卷积神经网络(Convolutional Neural Network ,CNN)」算法,由 18 个医生在线助理存储库和斯坦福大学医药中心,提供了 129,450 张涵盖 2,023 种皮肤疾病临床图片,完成深度学习的 AI;一边则是 21 名资深皮肤科医生。

  比赛分为两场。第一场,比试区分角质细胞癌和良性脂溢性角化病;第二场,比试区分恶性黑色素瘤和良性痣。

  至于结果,AI 正确识别良性病变和恶性病变的综合灵敏度达到 91%,与 21 名医生水平相当,甚至更优。

  这一比赛的意义在于,到 2021 年时,全世界几乎每人一台智能手机,而如果将这项智能诊断技术安装在手机上,那么每个人就都能对自己的皮肤异物进行拍照,扫描和分析,第一时间知道自己的患病风险了。

  而且,现在已有一家以色列公司 Emerald Medical Applications 开发了一款类似的手机应用,并在 FDA 注册。

  例子二:

  同样利用 CNN 算法的,还有 JAMA 报道的 AI 在糖尿病视网膜病变上的进展:

  Google 公司领导,美国和印度多家研究机构参与,由 54 名美国的眼科专家和高级住院医师,将 128,175 张视网膜照片进行分类和分级,让 AI 学会自动检测糖尿病视网膜病变和视网膜黄斑水肿,历时 8 个月,最终在灵敏度与特异性方面,最低值为 87%。

  例子三四五:

  而 Nature设立的子刊,Nature Biomedical Engineering,更是在 AI 方面连发三篇报道:

  ·来自我国中山大学的 AI 识别先天性白内障研究,已进入临床试验阶段,同样利用 CNN 算法,利用 410 张各种程度的先天性白内障图片和 476 张正常图片训练,即使是识别质量不高的网络图片,诊断准确率也达到了 92.45%;

  ·利用多层感知机(Multilayer Perceptron,MLP)算法,和受激拉曼散射显微镜(Stimulated Raman scattering, SRS)生成高度模拟传统的 HE 染色病理切片的新图像。通过过万张图片训练,实现 AI 在脑瘤术中的快速诊断,在病变样本中,区分胶质瘤和非胶质瘤的准确率达 90%;

  ·伦敦帝国理工学院则尝试了 AI 在治疗方面的应用,对神经假体进行精确控制,利用支持向量机(support vector machine, SVM)这一算法,将此前 85% 的精确度提升到 97%。

  当然,还有不那么成功的例子:

  老牌人工智能产品 IBM Watson 就与世界顶尖的 MD 安德森癌症中心,在去年底暂停了从 2013 年起合作的「消灭癌症」这一计划。

  不过,究其原因,大多数人倾向于认为,是 MD 安德森癌症中心自身在战略判断、定位、投入和管理等方方面面都出现问题,导致Watson 郁闷背锅。

  国内玩到哪一步了?

  北京友谊医院就牵出自己一手喂大的 AI 孩子:一个甲状腺结节超声图像诊断 AI,跟北京协和医院、北京大学第三医院、北京肿瘤医院、解放军总医院等 7 家三甲医院组团来战的影像医生战了一场。

  「其实,我们很早就在微信群里看到过『AI 要代替医生』这种说法了。」北京友谊医院超声科副主任胡向东说。

  这种代替威胁论的重灾区,尤其集中在图像分析领域,涉及超声科、放射科、病理科等科室。因为对 AI 而言,影像数据相对结构化,相比疾病的诊断和治疗,更容易些,技术也更成熟些。

  「你可以说,AI 对医生造成了一定的威胁,但也可以说,AI 能对医生提供很大帮助。」胡向东辩证了一把。

  她所在的超声科,其实很早之前就考虑过,想借助 AI 提高诊断率,也跟某家公司接触过,但没走下去。

  几年前,因为医院放射科在跟北京市计算中心合作肺结节的 AI,而后者还有过结肠癌病理的 AI 基础,双方一拍即合,超声科就这样跟北京市计算中心开始了甲状腺结节超声图像诊断 AI 的合作。

  「我们科的人,基本都参与进来了,大家态度还是很认真的,」胡向东说,大家并不是图新鲜玩一把的心态,「科里大多数人都参与了采图,最后选图的人也有三四个。」

  对医院而言,养 AI 这个孩子的第一步,就是喂它图,也就是胡向东说的采图、选图。

  超声图像本来存储在医院的工作站上,医生要先选择那些图像采集清晰的、病理结果明确的,拷出来,这个挑选过程,找到一份合适的病例,大概就需要四五分钟。

  然后还需要医生手动把图像上的结节框选出来,这个框图选图的过程,也需要一两分钟。超声科就如此操作,喂了过千病例的超声图像和病理结果。而且,喂图的食材还要保证均衡和质量。

  由于需要做穿刺的都是有恶性可疑点的结节,所以良性病例就需要医生额外补充给 AI 进行学习。而良性病例,需要同时满足穿刺结果为良、基因检测为阴性、随访时间超过半年3 个条件。

  至于恶性病例,则以穿刺或术后病理检测确诊为恶性做标准。以此,保证 AI 学习的每张片子,都是经过「金标准」检验的。

  但是,食精脍细条件下,仔细养大的 AI ,其实还面临要丰富「食材」的挑战。

  首先,这与超声本身的特质有关。超声不同于 CT 的客观成图,而是一种医生主观参与较多的检查方式,「面对同一个结节,可能我采集下来的图像,和你采集下来的图像,想表达的点是不太一样的。」胡向东解释,这首先就是一个可能影响到结果的因素。

  此外,超声仪器品牌众多,不同公司、不同款型、甚至不是同一个的仪器,成像特征都是有差异的。在图像质量合格的前提下, AI 如何消化掉这些来源不同的「食材」,也是一个挑战。

  「未来,AI 也许不需要人工框选结节,可以直接识别图像;也许,AI 甚至不需要人工采集图像,可以从头到尾全包。」胡向东说,目前只是起步阶段,未来发展空间还很大。

  而在 AI 学习了数百张图后,科室进行内测,诊断准确率接近于 5 年经验主治医师的诊断水平。

  这时,超声科主任钱林学提议,干脆搞个公开比赛,拉北京各家医院都来体验一下。于是,这就有了前面提到的人机对抗,而这也是国内首届人机读片竞赛。

  比赛现场,左边两台计算机就是AI,

  相比于普通计算机,只是主机略大;

  右边是北京友谊医院超声科主任钱林学。

  AI 在读片比赛进程中的状态

  比赛一共 100 道题,根据图像做出「良性」或「恶性」的选择判断。题目大多包含恶性可疑点,有一定难度。分上下半场,每半场限时 20 分钟。共 84 名医生现场参赛,他们除了按医院组成了 7 个团体,还有个人参赛的。同时,线上还有近万名医生观赛,如果愿意,也可线上比赛。

  在第一部分答题过程中,准确率排名前 25 名的医生,平均耗时 1,000 秒左右,而 AI 耗时 191.669 秒,正确率为 68%,而初级医师正确率 60.8%,中级医师为 62.4%,高级医师 66%。在第二部分答题中, AI 准确率达 76%,仅有 5 名医生得分超过了它。

  最终,在团体赛比赛结果里, AI 以 73.0% 的综合正确率获胜,用时 514 秒,领先第二名航天中心医院 0.3%。

  而在个人成绩里, AI 名列第 6,冠军属于解放军总医院超声科的张明博医生,她已有 8 年的读片经验,综合正确率为 76%,平均用时 909 秒。

  对 AI 取得的这个结果,北京友谊医院超声科的医生们,还是比较满意的:最终 AI 的成绩是,敏感性为 83.3%,特异性为 57.5%。

  其实,胡向东自己也参加了这个比赛,「我答得不好,」她笑着说,「感觉在现场比较容易受影响,比如第一部分结束后,会给出医生答错最高的五道题,我一看:啊?这一题不对吗?唉!这一题也没对!下半场的时候,我就想,还能按照这个思维来答吗?就受影响了。」

  不过她也说,有的医生表现得就很好,上半场过后,反而下半场更适应了,总体成绩更好了。

  其实,这就是人类的诊断率可能存在的波动,不如 AI 更稳定。

  丁香园也做了一些小的尝试

  丁香园、中南大学湘雅二医院、大拿科技曾共同宣布就皮肤病人工智能辅助诊断达成战略合作。

  基本分工是这样的:

  湘雅医院负责出 AI 所需要的「食粮」,提供海量的皮肤病皮损和病理照片,喂养我们一个 AI 宝宝。除此以外,他们还有专家团队,可以给皮肤病进行特征归纳和疾病诊断模型建立提供权威的专业支持。也就是有一个「厨师」团队,负责根据食材调整菜谱。

  大拿科技负责出技术和团队,他们写了一套图像识别模型,他们就像提供了一个受大众欢迎的菜谱,并且有一个很好的厨房。

  丁香园则因为在医疗行业积累多年的医生、患者、客户资源,成了这个餐厅的运营者,我们将会负责客人的招徕、服务以及为整个餐厅提供运营。

  或者,在我们的 AI 宝宝诞生以后,我们再来讨论这个问题,说不定会有不一样感受呢。

  

  Chen Zhang

  VC ,专注大健康产业,撸猫上瘾

  在整个人工智能创投领域,医疗一直是重点领域,获投项目的数量和融资额都非常高。下图是CB Insights 统计的人工智能在各个细分领域的投资热度。

  根据蛋壳研究院的数据库,人工智能+医疗健康的创业项目数量和融资额也在逐年上升,而且趋势极为明显。

  题主问人工智能医疗往哪个方向走比较好,我这里列了一共11 个方向,分为是风险管理、健康管理、生物科技、医学影像、药物挖掘、急救室监控、精神健康、可穿戴设备、虚拟护士助理、营养和病理。

  在这些公司中,风险管理类金额最高,医学影像类的融资次数最多。人工智能+大规模数据处理平台,可以更好地洞察数据的内在联系和价值。再结合专业的医疗数据库给出更合适的诊疗方案和医疗策略,提供病患的风险管理。其中,Zephyr Health获得了3250万美元的投资,Zephyr Health是一个医疗数据库,通过收集疾病数据,为医药健康行业提供解决方案,从而使医疗专业人员能为患者的找出合适的治疗方案。Apixio是一家医疗大数据公司,旨在为医疗机构提供大数据分析平台,方便医生进行更精确的诊疗,获得2610万美元的投资。Lumiata是首家利用大数据技术构建医疗知识图谱的人工智能公司,获得了1000万美元的投资,该公司通过图谱分析的方式,找到合适的诊疗路径,提高诊疗的精确性,更迅速的提出诊疗方案节约医生的诊疗时间。

  在医疗影像方面的项目最多,这不仅仅得益于影像数据拥有高质量、连续性好的数据特点,人工智能技术在图像识别上的高精准率、电子胶片的普及、放射科医师的缺乏均是重要的推动因素。人工智能在影像分析上的作用,投资者的认可度非常高。Enlitic开发了从X光照片及CT扫描图像中找出恶性肿瘤的图像识别软件,利用深度学习的方法之一“Convolutional Neural Network(ConvNet,卷积神经网络)”对恶性肿瘤进行诊查,获得了1200万美元的投资。而志在研发便携式医学超声成像设备的ButterflyNetwork获得了1亿美元的投资。

  2013年之前,关于人工智能初创公司的投资事件很少,之后逐渐增多。所有被投资的公司按地域分的话,属于北美的人工智能+医疗健康项目是最多的。因为人工智能相关的技术和模式在北美的发展是最成熟的。而中国和印度也逐渐出现了不少人工智能+医疗健康公司获得了投资者的认可。

  目前活跃度排名第一的投资机构是长期深耕人工智能领域的Khosla Ventures,所投的两个重要项目一个是Lumiata,另一个是Atomwise。Lumiata是一家预测分析公司,利用医疗人工智能,为纳税人、人口卫生机构和医生加强风险和照护管理。成立于2013,总部设在硅谷,团队由临床医生、数据科学家、和医学专家组成。Lumiata的核心预测分析产品是Risk Matrix(风险矩阵)。它需要有大量的健康计划成员或患者,采集他们所有的数据点,然后为每个人绘制出患病风险随时间变化的轨迹。Atomwise是一家人工智能药物挖掘公司。采用深度学习神经网络发现新的药物。该公司称自己在新药发现、结合亲和力预测和毒性检测上得到了世界上最好的结果。而排名第二到第五的投资机构分别是Data Collective、Formation 8、Intel Captital、Andreessen Horowitz。

  人工智能企业所面对的客户模式中,B2B模式是最多的,其次为B2C、B2B2C、混合型,这与数据采集的难易有关。人工智能的推动离不开几个要素,算法、大数据、物联网和计算设备。算法是核心,物联网和计算设备等硬件是基础(它们的发展不取决于初创公司),而数据则是各家公司成败的关键。如何获取数据,什么渠道获取数据进行智能学习是初创企业研究的重点。所以2B企业占多数是因为他们便于持续稳定获取机器学习的数据,比如IBM Watson一开始和纪念斯隆·凯特琳癌症中心的合作,就是为了获取癌症病历和数据。一支由医生和研究人员组成的团队一起上传了数千份病人的病例,近500份医学期刊和教科书,1200万页的医学文献给Watson。2C企业针对的是个人用户,则是以智能穿戴设备为主,从智能设备的传感器收集数据,然后再进行算法分析。

  在众多的2B 项目中,数量最多的是2医院。这点是统计前没想到的。可能是由于定势思维,我一直以为最多的2B 买单方会是药企和保险公司。出现种种情况的原因很多,特别是由于很多项目位于美国,而美国的医保政策正在向“fee for value”转向,所以按数量算,医院是最大买单方。但其实我觉得,如果按照金额算,还是有可能药企/保险公司最多。

  如果是按病症种类分,人工智能+医疗健康项目中最受关注是为以糖尿病为代表的慢病管理。糖尿病、抗癌药物、精神健康这三类都是治疗时间长、治疗费用大、治疗难度大的疾病。从盈利来说,研究这类疾病,也更容易获利,投资机构也更认可。

  

  Keegan Li

  1. Insert quarter. 2. Avoid Klingons

  几个回答都不错,我稍微泼点冷水:

  医疗行业由于其极度严谨和保守的属性,在新技术的应用相对其他行业来说,会慢很多,我们的衣食住行在近10年发生了巨大的变化,90后的生存状态和父辈们几乎完全不同。但是就医行为,习惯,哪怕是爱好,80,90后,和60后都几乎没有区别。还是更加偏向于去三甲医院,去拖朋友要个专家号,开刀要塞红包。

  人工智能遇到医疗,其实也一样的慢。

  尽管我们看到各种报道说人工智能怎么帮助医疗,怎么帮到了医生,其实大部分的内容还都在“新闻稿”范畴,真正数据智能和人工智能应用到医疗场景,我敢说,还没怎么开始。

  说IBM Watson进入中国,但和电子病历整合困难,数据传输的安全受到挑战,商业模式在中国不通,一直推行困难。

  说各种医学影像节约医生多少时间。实际上,一张CT片子机器只会看个肺结节,还有很多的问题机器不会看,医生还要从头到尾看一遍。

  说语音录入提高了医生的输入,但是让人头疼的是一边对着话筒说,一边用鼠标键盘去改错的字,发现其实也没节约多少时间。

  所以真的走进医疗场景看一看,人工智能还没开始真的发挥能力。

  拨开有些疯狂的新闻稿和电视节目,其实我们还是能看到人工智能之用于的医疗的本质。

  医疗的核心诉求,或者说是矛盾,是公众对于医疗服务的需求增长迅速,但是医疗服务的提供者并不会像司机一样,很容易去发展。

  工智能也开始将目光瞄准了这一点,并且去发挥技术智能的价值,比如辅助决策系统去帮助医生减少初级的失误,自然语义处理能将大量的历史病历做快速的整理,减少人工整理成本等等。预计2-3年的时间,我们会看到一些更加实用的成果。

  

  将门创投

  金融-投资咨询

  观点摘要

  ·人工智能在医疗领域落地将势在必行

  ·在比较短的时间内获取更多信息的唯一手段就是创新的技术

  ·需要一个既懂医疗行业,又能够在AI技术上跑得比别人快,跑赢时间的团队

  ·医疗领域特别适合人工智能,是这个产业中价值宝贵的一环

  ·医生不会被人工智能取代

  人工智能在医疗领域落地将势在必行

  ▼

  当AI+医疗的问题被提出来的时候,我们必须要看人工智能是否真正的带来了医疗领域的实际价值。我们觉得人工智能在医疗领域落地将势在必行,并不是被看好,并不是市场大,而是势在必行。

  因为健康是每个人生存的基本需求,中国是人口大国,原来世界卫生组织有一个数字,中国一千个人中可以平均到1.5个内科医生,这意味着什么?意味着只有通过创新技术的手段,才能使得医生把最宝贵的时间花在最重要的事情上,使更多的人收益。因此创新技术在这个领域是势在必行的。

  同时,医生在看病的过程中的很多时间是排除法,为什么老是最后一个医生看得最准?因为前面的都被排除了。所以在一个时间点,在几分钟的时间里,如何使医生获得最多的信息,包括之前的病历,这一段时间连续的数据,当他有了足够的信息的时候,他就可以更精准的判断你到底是什么问题,得到什么样的治愈,在比较短的时间内获取更多信息的唯一手段就是创新的技术。

  人工智能需要更多的耐心

  ▼

  中国的医疗数据是特别庞大的,但其中超过70%是影像,视频等非结构化数据。人工智能技术,能够识别非结构化数据,还能给予更多维度的洞察,切实帮助医生做判断,这使得人工智能技术在医疗领域需要势在必行的落地。

  人工智能在医疗领域落地的场景实在是太多太多了,不管是在辅助诊疗、医疗影像、手术机器人、健康管理、新药研发,每一个环节都有人工智能实实在在的落地场景,而作为投资界,当他看到了特别大价值的时候,最关注的一件事就是因为这件事情激活的时间节点是什么。

  当他看时间节点的时候,其实我们就会看是不是在这个行业里大鳄已经入场了,生态起来了。我们看到IBM Watson、Google、微软,还有垂直领域的GE、Siemens都在重金投入这一领域,并且有实际的应用方案落地。这证明了这一领域的成熟。

  在这种情况下,作为创业团队,为什么又觉得好象还在摸索的过程呢?因为在这个领域虽然看到了巨大的价值,虽然看到了大鳄的入场,虽然看到了清晰的场景,但是还是需要那些落地的路径。因为医疗领域是全世界最为严谨的行业,因为这关乎生命关乎安全,任何新技术的尝试都要最严谨,以及相关的法律法规的问题,如何形成商业壁垒的问题,在这个领域创业的小伙伴一定要坚信这个领域的价值,但是要多一点耐心。

  中国AI人才的断层会在两年内补缺

  ▼

  我们会特别看重在这个领域中、这个行业场景中,对这个技术有最大需求的,数据质量相对优的,发展、推广起来相对容易的场景路径。我们会选择什么样的团队呢?AI的医疗团队特别不容易找,特别难,因为做医疗行业的人才就非常的少,再加上AI在中国是人才的断层,这个断层会在两年内补缺,绝大多数的AI一线公司全部是科学家领衔,或者是研究院在一线,所以需要一个既懂医疗行业,又能够在AI技术上跑得比别人快,跑赢时间的团队。我们自己特别看重,虽然在这个领域中做的团队很多,但是他的切入点是不是那个落地的路径节点,以及是对的团队,或者是有特别独家的竞争优势,如果我们找到了这样的团队,我们是毫不犹豫跟他一起走下去的。

  回归医疗商业本质,形成业务闭环

  ▼

  人工智能成为风口已经是不用赘述了,任何一个新技术的发展必然会经历,比如说这是一个新技术,到开始特别特别的热。其实激活整个人工智能使其突然变成风口的,是源自于AlphaGo对全民的普及,让大家明白了这项技术到底可以做什么,以及各行各业能够做什么,产生了无尽的想象。

  但是人工智能真的不是一个新技术,是一个60多年的技术,是一个发展中的技术,所以叫做有所为、有所不为。人工智能能做的事和不能做的事是非常清晰的,并不是我们想象的那样不能做什么,所以要选择能够做的,真正能够辅助人类提高效率的。

  在这样的技术发展过程中,商业模式又是什么?就是回归商业本质,是否真的能够在里面变成闭环的业务。比如说,病理应该是人工智能特别看好的细分领域,中国特别缺病理的医生,中国是7万人一个病理医生,所以如果是按照国家规定,现在中国的病理医生有9千多,缺口有4到9万人,最快的弥补这个缺口只能靠技术。

  看病理医生的水平又是完全不一样的,好坏差距非常大,所以中国的癌症的5年复发率是远远高于别的地方的。

  第三个,这个领域特别适合人工智能,有所为,有所不为。任何一个病理的切片都承载了巨多的信息,可是这个信息在人眼看,都是非常疲劳和难的,而机器一定比人看得好,一定能够辅助,这件事情已经不是一个想象了,在很多地方都是非常成熟了,所以我们觉得像这样就回归到了医疗商业本质,就真正能够变成这个领域中可以真正对病患提供更准确的价值,从而给予更精准的治疗方案,真正解决医院、医生的问题,可以成为这个产业中价值宝贵的一环。

  人工智能有所为,有所不为

  ▼

  人工智能有所为,有所不为,用一个简单的方式衡量,就是快思考和慢思考,任何快思考能够做出的东西,机器一定比你好。比如说看一个东西,看片子,都会比你好。而任何的慢思考,机器永远做不过你,比如所有的医疗最后的判断源自于更多的纬度的,是根据很多的信息综合的,所以根本不要考虑被替代。AI在医疗势在必行,回归商业价值。

  

  zhan feng

  医生

  放射科AI诊断领域国内非常多公司来求合作,几乎全是在做肺结节(最简单嘛),磨玻璃结节其实我们很容易漏,但是又是早期肺癌,很容易赔钱!这年头签个肺HRCT真是如履薄冰,眼都快看瞎了!这方面我们很看好AI辅助,但是见过某公司软件,临床很常见的肺结核病人,几百个结节都都给我算一遍,这就是添乱!

  虚火是有的,但也大势所趋吧!

  

  IBM中国

  我们邀请到了IBM中国研究院资深研究员李响博士来给大家介绍一下人工智能在医疗领域的发展和应用。

  人工智能在医疗领域的应用已经有了很多进展,尤其是慢性病和癌症等复杂问题是人们最为关注的话题,让我们来了解一下IBM的认知医疗是怎么发挥作用的。

  首先,我们面临着不可避免的医疗资源分配不均问题。

  我们说到“慢性病”,很多人想起来的是“糖尿病”、“高血压”、“心血管疾病”。比如:高血压。并且身边很多高血压患者平常开药、做个检查都喜欢去大医院,尤其是三甲医院。虽然慢性病非常常见,但是治起来其实很复杂,很多情况下都是需要综合的管理和组合的用药,所以我们现在很多患者还是更信任三甲医院的这些专家。大医院就医的压力就会非常大。因为大医院的医生水平虽然很高,但是他其实也承担了很多像临床、教学、科研这方面的任务。如果大多数慢病患者能够在基层就能够得到有效治疗的话,那对于患者本身的治疗效果,以及缓解医院的压力应该都会非常有利。

  糖尿病,其实是全球医疗的一个大难题。一个是患者数量特别庞大,有预测到了2040年的时候,中国糖尿病患者将达到1.5亿以上。另一个问题就是说,其实并不是所有糖尿病患者都死于这个病本身,而是他可能会引起多种严重的并发症。比如:心梗、脑梗、肾衰竭,这些都是非常致命的并发症。所以在任何国家,其实人们对于糖尿病的治疗的花费,都是所有疾病中最高的。而在中国其实控制的现状也不容乐观,首先现在糖尿病的确诊率比较低,大概只有30%。治疗率大概只有25%左右,其实这个面临的压力是非常大的。

  为了更好的去帮助患者,我们应该提高确诊率和治疗率。但是对于基层医院来说,它就要发挥更大的作用。包括:提升他们的诊疗水平和相关的医生能力。这个对于他们来说,这些方面一定要得到非常大的一个提升。

  那么 ,如何运用认知医疗来解决慢病管理问题呢?

  首先,需要从慢性病的管理模式来入手。我们利用人工智能和认知计算技术来武装我们这些基层医院的全科医生,从而系统的提高慢性病的管理水平。

  慢性病是要管理,而不是去治疗。因为我们说的“管理”其实是一种综合的能力,IBM的认知医疗就是要帮助我们这些基层的全科医生,掌握从对慢性病患者的从问诊、开药,到随访的全程管理能力。

  IBM的认知医疗是从以下两个方面辅助全科医师进行综合管理的:

  一方面,IBM的认知医疗系统能够学习最新、最细节的医学知识。比如:我们能在17秒内阅读3千多本医学专著,提供几十种治疗方案和十万份以上的临床报告。另一方面,我们也会基于实际的这种临床数据,从大数据中挖掘出类似病人的诊治信息,再根据每个人不同的情况。比如:他以前吃过什么药。比如:他的血压血糖的信息,提供不同的治疗方案。

  我们建立了糖尿病的智能决策系统,来帮助基层的全科医生实现糖尿病的精准治疗。我们会根据糖尿病人的不同疾病情况,为他推荐“到底是使用胰岛素治疗”,还是使用不同的“口服降糖治疗的方案”。对于他并发其它疾病,比如:并发 高血压或者高血脂的患者,我们也会对他推荐相应的降压或者降脂治疗方案。除了他目前的疾病情况,我们还会去预测他未来发生各种并发症的风险。比如:发生急性心血管疾病的风险。对于这些高风险的患者,我们也会推荐医生给予特别的关注和预防。

  这种智能决策系统能够帮助基层医生更加准确的帮助糖尿病人进行用药。在综合管理当中,除了问诊、开药之外,随访问题也可以通过“对话式随访机器人”来解决。它能够为病人提供这种连续的个性化诊疗,在微信上安装这个小机器人之后,它就会像医生一样问一些有针对性的问题。比如:你今天的血压怎么样,你今天的血糖怎么样,你今天吃了什么。病人回答这些问题之后,系统就能自动的去理解这些答案,然后把这些信息收集起来,并且基于它来写出《随访报告》。

  “精准医疗”——真正帮助医生实现精准化慢病管理

  认知计算技术的目标是为了实现患者的精准分群和精准的预测。比如:对于某种心血管疾病的患者来说,在服用一种特定的药时,如果剂量不够,它可能效果就不好。但是剂量大了呢,它又可能会引起一些负作用,比如:出血。所以这个“度”的把握呢,就非常考验医生的能力和经验。针对这个问题,已经通过跟北京的一家著名的三甲医院合作,通过我们的认知计算技术,把不同风险指数的病人进行了精准的分群。这样该吃药的病人就吃药,不该吃药的病人也不会进行过度的这种治疗。

  我们还和另外一家医院合作,开发了针对心梗病人的风险预测模型。其实影响心梗病人发病的因素有很多,加起来可能有将近一千项。很多时候其实医生也不太确定,哪些因素是导致这种病人发病的决定因素。是病人自己的病情重,还是治疗的手段不得力,还是说因为他的经济状况,甚至说还是因为他的家庭因素导致的呢?根据我们的模型,我们就能得到一张“风险全景图”,最影响这种心梗风险的部分就能一目了然了。

  举例来说,我们通过这种大数据分析技术,发现跟配偶一起居住,对于心脑血管疾病是一个很好的保护性因素。也就是说,家庭生活幸福的人,他的心脑血管疾病的风险会低很多。

  由此可见,在IBM人工智能的帮助下,已经可以对慢病病人实现的全面、精准和个性化的管理。咱们身边慢性病的患者大多都是老年人,希望认知医疗在未来能够得到一个更大的发展,让这些患有慢性病老年人,在家门口的社区医院,甚至足不出户就可以得到一个个性化的温暖照顾。

  

  云博士

  人工智能医疗健康

  《新英格兰》曾刊出了一篇观点文章《机器学习和医学预测--远超过高期望的峰值》,文章的批判方法算是很给深度学习这个新工具留面子了。参考这篇文章:业内人的“针砭时弊”:AI医疗界的3大乱象以及如何评价医学人工智能的成果?文中提及“ 回观国内市场,这些不靠谱、不合医学逻辑和没有临床价值的事情反而愈演愈烈,耗费了大量的资本和医疗资源,可谓几大乱象......“。

  笔者认为,目前AI在医学影像方面的努力还是很值得鼓励的,只是要真正击中诊断环节中医生的痛点,还得进一步向曲径通幽处前进。

  一是前文提及的“使用医学而不是计算机工程的评价体系来衡量人工智能系统是否靠谱”。用AUC(ROC曲线下面积)、Sensitivity (敏感度)、Specificity(特异度)等性能评价体系。而不是Accuracy (准确率)、Precision (精确率)。不难理解,为什么公关软文中最常出现“准确率超过95%”,“精确率超过98%”,云云。下次再读到“准确率超过95%”的时候,我们可以这么想,准确率95%可能意味着系统蒙答案的时候主要蒙A选项,然后测试样本中的A占绝对多数;那么再读到“精确率超过98%”的时候,我们可以这么想,系统的敏感度可能只有30%,在他能够报出为阳性的时候,绝大部分是对的。

  二是与医学团队合作,整合生物学特征feature,或者被生物学特征整合,形成真正的集成诊断系统。实际上,在AI大热之前,科学家尝试将影像技术与基因技术有机结合,进行疾病的诊断。

  放射组学Radiomics的工作流程一般为:

  (1)获取高质量的标准图像;

  (2)分割出含有肿瘤等的感兴趣区域;

  (3)提取图像特征,如密度分布、不同密度层面的空间关系,纹理特性以及肿瘤跟周围组织的关系;

  (4)建模。值得注意的是,这个任务,生物学家做了很多年,如果能够将影像学特征feature,与生物学feature集成建模,形成多模态AI系统,将是一种完美的结合。

  

  SFHZ

  肿瘤学博士

  互联网+医疗的核心是“连接connection”,针对的是我国医疗质量分布严重不均的问题。互联网+医疗无非是获得医生的一部分咨询服务时间,然后重新分配给患者而已,并没有怎么提升效率,至于最根本的医疗质量提升就更没有了—导致这个结果的原因是多方面的,但这是到现在互联网+医疗商业化没有成功,估计以后也不会成功的根本原因。

  而AI+医疗的本质之一是“增强智能augmentedintelligence”,这可能导致医疗质量的提升,或效率的提升,或同时提升质量和效率。AI+医疗本质上是聚集顶级专家的智能-->学习顶级专家的智能-->应用顶级专家的智能,然后赋能给单个的医生,辅助他进行临床决策和/或操作。所以这里面能多大程度上赋能医生是关键因素之一。目前的产品都是人工智障+医疗,简直是拖医生的后腿。号称自己提升了几个百分点的都是新闻稿,看看就行。不是说他们报的数据有假,而是这里面到底有没有1%能转换并且已经转换成了医生或患者的获益?

  医疗人工智能当然大有前景了,这点毋庸置疑。

  应该怎么样找着重点才能最大化满足人们的需求呢?--找能真正给医生赋能的领域和环节,炫技是没有用的。这需要对临床有深入的理解。但是目前不管是人工智能的初创公司,还是大公司,都是AI人员主导,而不是临床顶级医生主导,这就很尴尬了。这也是为什么都扎堆在影像和病理的原因,因为不知道还有哪些领域哪些环节还可以炫一炫AI的技术啊。

  产品方向和商业化的几点思考:

  1、 产品不需要达到100%的准确,因为人也达不到100%的准确。

  2、不必在意AI是辅助医生还是取代医生,这根本不重要,吻合器能收费,辅助的各式手术刀的使用也能收费。

  不必在意到底To B还是To C甚至同时To BTo C,不过To B的时候也许增强智能很重要,但是To C的时候精准的预测下一步可能会更重要。

  3、 诊断领域可能比治疗等领域的技术上和商业化的困难都要大。技术上因为诊断领域是需要解释因果的,但是深度学习的黑箱子如何解释?治疗领域就不需要解释因果,我教你做手术,你能95%以上的相似度操作就可以了,不需要因果。

  商业上来讲,诊断领域也很难。是因为很多人不了解诊断的作用。影像诊断也好,金标准病理也好,都是辅助临床医生做决策的,诊断是为了服务于治疗,最终拍板的是临床医生,不是影像医生也不是病理医生。这中间的路径太多太长,难度太大。而且中国人不大愿意为诊断付钱,治疗是愿意花钱的,花几万甚至十万找个好的外科医生飞刀我们是很愿意的。

  还有一点,长远来看,诊断的想象空间其实是很小的,不要被每年几亿张这种数据误导。除了自动读片(不说准确度和收费的事情),你还能干点啥?

  4、 想要因为提升了医生的效率让医院买单是很难的,基本没门,医院想的是怎么创收,至少不能让我花钱,真要花钱也要花的理所当然。所以要医疗AI要商业化,基本上只有两条路吧。一是硬件化或软硬件结合,二是附加其他高附加值服务变成按单个患者收费的SaaS模式—封闭的、不符合我国患者实际情况的IBM Waston同学正是这么在干啊,花大代价砸开政府收费部门建立收费栏目啊,产品不咋地本土化倒是打的一手好牌—就想问,IBM Waston在中国获得CDFA审批了吗?没审批凭什么有收费栏目?

  5、长远来看,数据网络效应很重要。如何实现完整的闭环,有战略性的获取数据将是长期核心壁垒。

  医疗AI产品研发:

  1、 清晰的产品定位和出发点:核心问题是“我们这项AI的产品或服务(结合其他产品和服务)到底是要解决什么人在什么场景下的什么问题?产品/服务实现的场景应该是如何的?”,而不是“我们拿这些数据能干什么用”。

  搞清楚这点至关重要,一是辨别是不是自high或伪需求。二是可以不断听取目标客户的反馈。三是在一开始有很好的全局观,能大体估计难度、需要的资源、涉及到哪些专业人士、协调不同专业的超级协调人员、数据的数量和质量、研发的进度、第一版产品的模样等。搞不清这些,把肺结节识别准确率达到200%,也没有一毛钱作用。我们不是要解决技术问题,我们要的是借助技术达成目标。

  2、 高质量的数据标注。在少量高质量数据和海量低质量数据之间找到合适的样本数目很重要,高质量的consistent的数据标注也至关重要。

  3、 不能说AI技术不重要,深度学习还是很有优势的,尤其是数据量有优势的话。

  4、 合作无间、背景不要差太多、职能相对整齐的产品团队。怎么说呢,中间坑太多了。

  哎,希望我司人工智能的产品研发顺利,能有机会早日面世,目前它还只是3年以内年资住院医生的水平,而且它还是个瘸子,就先不献丑了。看看这个月能不能到达中等年资医生的水平吧。

  

  讳莫如深

  外贸出口

  在某家做智能医疗的公司实习过一段时间,主要是处理数据兼做模型,说说感受吧。

  公司的业务起步主要围绕肿瘤展开,和一些大的肿瘤医院达成合作,从医院现场获取数据,包括病历、身体检查等一系列数据(当然是经过脱敏处理的,保护患者隐私),公司的业务流程就是将这些繁杂的数据以一定的逻辑规则化,筛选出有价值的数据,当然这个筛选的过程是和肿瘤专家紧密合作的,毕竟什么信息重要什么不重要还是专家说了算,比如各种身体检查,各种指标,各种肿瘤术语等等。轮到我们的工作往往和统计、数学模型有关。

  接下来就可以撒欢儿的使用各种模型分析数据啦,比如最简单的做一个分类,在一系列病理特征(表征为特征向量的形式)的基础上做一个多分类器,预测出哪一种肿瘤的可能性比较高,或者高端一点用深度学习模型来做预测。

  重点是,这一切的分析结果,都是辅助诊疗,也就是说,这个预测结果都是给医生看的,

  说白了,仅!供!参!考!

  我觉得这样其实很合理,毕竟在医疗领域,大数据真正发挥作用的时期还远远没有到来,经验丰富的医生才是最终的decision maker,这一点将在很多很多年内不会变。

  不过也许以后随着数据库的健全,例如电子病历的普及,统计学等等数学模型可以在真正的大数据上发挥作用的时候,智能医疗必然会在临床诊断等情境下扮演更加重要的角色。医生为什么可靠,因为他的经验丰富理论扎实,这样看的话,大数据(云医疗)正是一种基于宏大的数据海洋产生的诊病方法,也是基于统计学的科学诊断,也是在广泛的病例中总结一般规律,与单个医生几十年的行医经验相比,广泛的病例数据或许更加可信。

  总结,目前来说,智能医疗的主要方法依然是数据分析(医学影像处理另当别论),利用统计学来对可能的疾病或者病因进行推断,给医生一个参考。

  不要总抱着把人命交到机器手里是否符合伦理这事儿不放,实践说明一切,有时间质疑这质疑那为什么不好好学习一下机器学习这些模型背后的思想和逻辑呢?有时间质疑为什么不去了解一下AlphaGo怎么下棋的呢?

  

  Matthew Wang

  医疗工作者

  IBM Waston系统是做的非常好,能看出来IBM是真正花时间、投入人力、物力做出来的。

  影像方面做了很多分割的工作,比如将器官部位识别、主动脉提取,以及主动脉瘤自动检测。

  工作做的还是蛮细致到位。

  不过感觉临床方面似乎与医院实际需求有一定的不),比如主动脉瘤的自动检测,我听医生讲只要拉出矢状面、冠状面,主动脉瘤一般不会漏诊的,CTA一眼能看出来,在横断面的确会漏诊,但也不多。另外,听医生讲即使有4到5CM的主动脉瘤漏诊,对临床方面影响也不是太大。因此这个器官自动识别加上主动脉瘤检测实际的意义可能打了很大折扣。

  不过IBM有其他几个我觉得做的很好。这里就不说了。

  我的意思是说,人工智能一定要解决临床方面医生诊断有难度、容易误诊漏诊、难以精准量化的方面,医生的体验才会更好。其次人工智能如何让医生、医院、医疗机构挣钱,即商业模式、盈利模式也是需要考虑的事情。

  我觉得IBM做的真是非常好,毕竟是花了一大笔钱的。

  人工智能需要有钱才能做的起来。

  以上来自“知乎”网友评论