谁说人工智能必须要大数据?斯坦福大学用新算法助力药物研发|界面新闻?JMedia

作者:王晓行

深度学习算法的能力是惊人的,从识别猫和狗,到识别医学图像中的结节,算法的表现已经超越了人类,但是这些算法模型需要大量的数据来进行训练,所以现实中人们以为大数据是人工智能的基础,但是最近美国斯坦福的研究团队研究出了一种新算法——一次学习,并将此算法应用到新药研发领域。动脉网了解到这一研究成果于4月3日发表在《ACS Central Science》期刊上。

在第一项实验中,算法学习了6个化合物的毒性后对另外3个化合物的毒性进行了预测,在第二项实验中,算法学习了21个药物的副作用后预测了另外6个药物的副作用。在这两项实验中,算法预测的准确性都比随机猜测更好。

该团队的人员斯坦福大学化学教授Vijay Pande表示:“我们正在尝试使用机器学习,特别是深入学习,用于药物设计的早期阶段。关键是,如果你已经有成千上万个药物设计的方案,你可能已经有一个成功的药物”

不过该小组承认,由于数据量太少,将一次学习应用于药物研发还不是很成熟,不过还好他们曾经获得过成功过的机器学习算法应用于药物研发,只需要数百个数据量,他们就可以测试一次算法的准确性。

斯坦福化学教授Vijay Pande(图片来源:LA Cicero)

为了能够更好的分析数据,研究人员用原子为基础的几何图形来表达药物的分子结构,这样就将药物分子转化成算法可以识别的信息,用这种方法做实验就处出现了上文提到的实验结果,算法预测的准确性都比随机猜测更好。

Pande实验室的研究生Bharath Ramsundar 和研究人员Bharath Ramsundar说:“我们研究了一些原型算法,发现在给出了一些数据点后,他们能够做出非常准确的预测。” 。

然而,Ramsundar警告说这不是一个可以称之为“魔法”的技术。实验数据是建立在特定情况下的一次学习的几个最新进展,它的工作原理是依靠不同分子的紧密性和相似性。举例来说,当研究人员对毒性数据进行了训练后,再对副作用数据进行测试,算法完全崩溃。也就是说算法要么仅测试毒性,要么仅测试副作用。

这个团队也强调了一个观点,那就是人工智能不会取代人类,这个算法最后会成为化学家的工具,当化学家在进行候选药物设计方案进行选择的时候,一次学习会给出更靠谱的算法,因为现在他们全凭感觉。

动脉网了解到除了应用在药物研发领域以外,该工具还适用于分子化学。Pande实验室已经在太阳能电池的不同化学成分上进行测试以获得不同的结果。他们还制作了用于实验开源的所有代码,作为DeepChem库的一部分。

最后Pande表示,这项技术还没有到最后应用阶段,仅仅是个开端,但它开启了一个新领域!

原文链接:

论文链接:

更多专业报道,请点击下载“界面新闻”APP