今日《科学》:彻底颠覆蛋白质设计!AI带来又一项重大飞跃

  近年来,AlphaFold等人工智能(AI)工具的出现,在生命科学领域促成了多项突破性进展。蛋白质的功能预测与设计成为最先受益的领域之一,该领域的重大飞跃正以难以置信的速度不断涌现。

  其中,华盛顿大学David Baker教授是其中的代表性人物。就在AlphaFold横空出世后不久,Baker教授团队开发出能够预测蛋白质复合物结构的RosettaFold工具;此后,团队又开发了从头设计蛋白质的全新方法,将设计蛋白质的时间长度从“月”缩短至“秒”;他们还成功定制了具有特定特征的全新蛋白质结构……要知道,就在几年前,预测蛋白质三维结构都遥不可及,更不用说从头进行设计了。

  今天,在最新一期《科学》(Science)杂志上,Baker教授团队带来了蛋白质设计的又一项革命性突破:利用强化学习,“自上而下”(top-down)设计蛋白质复合物结构。这套颠覆了传统方案的全新突破不仅可能为我们带来更有效的疫苗及药物,还有望引领蛋白质设计的全新时代。

    目前的蛋白质设计采用的是“自下而上”(bottom-up)的思路:蛋白质单体首先形成对称的寡聚体,随后再进一步组装形成具有特定结构的蛋白质复合物。这套方案已经在生物医学、免疫学等领域发挥重要作用,包括助力新冠疫苗的设计。

  不过,尽管“自下而上”的设计具有产物结构牢固可靠等优势,但这一策略也有明显的缺陷:AI只能依据已有的寡聚体元件来搭建最终的蛋白质复合物,并且无法从全局来直接优化整个蛋白质结构的性质。

    ▲最新研究利用强化学习策略设计的蛋白质结构(图片来源:Ian Haydon/ UW Medicine Institute for Protein Design)

  为了从根本上解决上述问题,Baker教授团队在最新研究中采用了“自上而下”的强化学习方案,使用蒙特卡洛树搜索算法来生成蛋白质复合物。其设计思路与以往的方案截然相反:直接根据预想的结构特性来优化蛋白质片段,进而构建单体亚基。

  所谓强化学习,简单来说是一类基于不断试错的机器学习策略:计算机程序通过尝试不同的举措、收取反馈,在学习过程中作出最佳决策。这个名词可能有些陌生,但近年来在棋界所向披靡的AlphaGo,正是基于强化学习设计的。当AlphaGo学习下棋时,计算机会测试不计其数的走法,根据这些走法导致的结果(赢棋或失利)进行学习,并不断总结出更有希望取胜的决策。

    Baker教授表示,强化学习不仅精通下棋,经过训练还能解决蛋白质科学中长期存在的难题,创造出有用的分子。

  要将这一策略应用于蛋白质设计,研究团队首先要向计算机提供大量简单的起始分子,以及一个预期的结构特性作为合成目标。这时,计算机模型就会通过上万次随机尝试来接近目标:以一个螺旋结构为起点,通过末端随机连接一个螺旋或环区结构,蛋白质不断延伸或扭曲,就像是走出一步步的棋。通过蒙特卡洛树搜索,最终接近、实现预想中的复合物形态。

  目前,研究团队专注于设计由大量蛋白质分子组成的纳米级结构。电子显微镜观测证实,AI设计的大量蛋白质纳米结构都能在实验室中生成,并且原子处在正确的位置上,实现了精确设计。

  为了验证这一策略的可行性,研究团队利用AI分别设计出了碟状纳米孔以及超紧致的二十面体结构。其中,利用螺旋结构组装成60亚基的二十面体结构蛋白质衣壳是以往的“自下而上”设计思路无法构建的,但基于最新设计方案,其冷冻电镜结构与计算机模型非常接近。初步的生物学实验已经展示了利用该方法生产疫苗的抗原和信号分子,从而分别提升疫苗效果、促进血管生成的潜力。

    对于这项研究的前景,Baker教授指出:“如果该方法应用于正确的研究问题,还将加速多个科学领域的进展。”论文共同通讯作者Hannele Ruohola-Baker教授认为,随着准确性的提高,该策略在糖尿病、脑部损伤、中风等心血管疾病的治疗中具有潜力。此外,或许这项技术还有望用于调控细胞发育与衰老过程。也许在不久的未来,我们就将看到基于这项全新设计思路的药物或疫苗造福患者。

  参考资料:

  [1] I.D. Lutz et al.,?Top-down design of protein architectures with reinforcement learning. Science?(2023) Doi: 10.1126/science.adf6591

  [2] Reinforcement learning: From board games to protein design. Retrieved Apr. 20, 2023 from https://www.eurekalert.org/news-releases/986267