重大突破!85后河南小伙论文登顶《Nature》正刊,11分钟解决“世界性”难题

  北京时间5月2日,国际顶级学术期刊《自然》发表一篇来自百度的重磅论文,该论文提出了mRNA序列优化算法LinearDesign。这项研究带来的效果十分明显,只需11分钟锁定最稳定的mRNA序列就能解决传统方法万亿年都搞不定的事。这也是中国科技企业首次以第一完成单位的身份登顶《自然》正刊。

  

  论文第一作者为百度研究院资深研究员张贺,是一位来自河南的85后计算机领域博士。张贺在高中时代与生物学结缘,更在读博期间深入研究计算机和生物学的交叉方向。

  

  特别牛的是,这篇论文还得到了与曾经名噪一时DeepMind提出的AlphaFold2同等待遇,可以“加速预览”形式最快发表,这意味着全球学术界对该项研究的高度认可。

  一个困扰斯坦福大学生物化学系教授的难题

  近年来,疫苗研究、生命科学等颇受关注,而mRNA作为一种全新的疫苗类型,也在疫情期间成为科学家们攻克的主阵地之一。疫情期间,RNA设计领域世界知名专家、斯坦福大学生物化学系Rhiju Das教授关注到疫苗研发存在的一个非常棘手的问题:找到一个既具有稳定二级结构,而且还有效的mRNA疫苗。

  这个问题也困扰科学家们多时,由于无法高效设计出稳定、成药性更好的mRNA序列,导致大量疫苗、药物研究的进程被延迟。

  举个例子,采用穷举法去找一条稳定的mRNA序列,需要查看10的632次方个候选序列,可谓“天文数字”。这样的操作就像“大海捞针”,如果用超级计算机来计算,很可能算上万亿年都搞不定。

  而用人工智能的技术方法去解决生命科学中的问题,为科学家提供了新思路。

  百度设计的LinearDesign算法,将自然语言处理领域技术用在疫苗研究上。通俗点说,就像句子是由单词排列组成的,mRNA序列则是由碱基序列组成的,两者都会形成某种“结构”。百度研究人员用AI技术,提前设定结构稳定mRNA序列的一种“结构”,再根据这些“按图索骥”去找到最符合要求的候选序列,就像是在发音相似的句子里,找到最有可能的那一句。

  通过AI技术,11分钟解决“世界性”难题

  这项研究带来的效果十分明显。如今,LinearDesign算法只需11分钟锁定最稳定的mRNA序列,能解决传统方法万亿年都搞不定的事。不仅让疫苗研发更高效,也让疫苗研发更有成效。

  以新冠mRNA疫苗序列为例,对比疫苗公司提出的序列,百度算法设计的序列稳定性最多提升5倍以上,抗体反应最多提升128倍。

  自2018年百度开始在生物计算领域探索,包括AI+生物计算平台-螺旋桨PaddleHeli、文心生物计算大模型等,在这些技术能力上面向新药研发、疫苗设计、精准医疗等关键场景,为生物医药领域研究者、从业者提供算法工具及解决方案。

  前不久推出“国民级”大语言模型文心一言,如今基于文心大模型,又有生物计算研究成果登上顶级期刊Nature。百度文心大模型已经形成了产业级知识增强大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算、行业大模型等,技术加持让硬核科技创新成果持续涌现。