破解细胞代谢网络的“黑匣子”,上交团队开发智能代谢重编程平台,推动合成生物学的理

  《三体》小说中,在引力作用下三体星系为毫无规律的混沌体系。正是因为这样,导致恒纪元与乱纪元交替轮换,三体文明不得不一次次终结。

  在合成生物学领域,也存在与三体相似的混沌现象,困扰着合成生物学领域的科学家和工程师们。细胞的代谢网络混沌特性十足,其由多达上万种代谢物、上千种酶,以及它们之间的错综复杂的相互作用构成,是人类已知的典型的超级复杂系统。目前,人类对代谢网络的认识还相对片面,而且静态认知居多。这是认识、改造和重塑代谢网络的巨大“天然障碍”。

  代谢重编程(Metabolic reprogramming,MRP)是细胞代谢网络在全局水平上的状态改变,它与细菌耐药性、癌症进展、癌细胞耐药、细胞分化等密切相关。代谢重编程也是科学家控制和改造细胞,用来进行生物制造的核心手段。因此,如何理性地研究认知代谢重编程,并利用它高效地控制细胞代谢已成为众多科学家的迫切需求。

  

  图丨上海交大研究员为该论文通讯作者之一(前排右三),上海交大博士生为该论文第一作者(后排右二)(来源:)

  基于此,上海交通大学团队提出一种全新理念。他们从细胞感知外界环境刺激的感知基因入手,使用 CRISPR 技术对感知基因进行随机组合干扰,在一个瓶子中就可实现模拟成千上万种不同的环境条件,并对这些环境条件刺激的代谢效应进行测定。

  这样就可以轻松地获得细胞的“敏感节点”基因受到刺激后,作出反应的“大数据”。再通过该团队开发的算法,从这些数据中解读出细胞对各种环境刺激做出反应的规律和机制。基于这些机制,人们可以方便地进行代谢网络的重新编程,从而更加理性和方便地控制细胞的代谢。

  此外,该 团队为这一理念的实施开发了一整套工具箱,包括工具载体、分析算法和实验方法指南。并且,为简化智能代谢重编策略的应用,他们还提供了基于 Web 的一站式服务(https://smrp.sjtu.edu.cn)。

  科研人员利用该平台,可以轻松地完成从实验设计到数据分析报告的全部研究流程。从新视角对细胞的代谢网络进行认识和理解,进而通过所得的规律和知识进行细胞改造,为细胞代谢研究和合成生物学研究提供了一种高效、理性、便捷的新方法。

  认为, 代谢网络设计会逐渐向数据驱动的方式发展。未来 科研人 员设计代谢网络时,不再只依赖发表 的文献和科研人员的 知识、 经验,而需要更多地依靠和利用数据驱动。

  “就像现在的 ChatGPT 一样,数据驱动将能够帮助科学家从更高的维度上理解代谢,有望颠覆人类的认知,并从人类意想不到的角度为科学家带来惊喜,这从本质上与传统理念中的生物学研究截然不同。”他解释说道。

  图丨相关论文(来源:Research)

  近期,相关论文以《利用相互作用的感知基因对混沌的代谢进行理性重编程》()为题发表在 Research 上 [1]。

  

  通过 SMRP 平台为整个代谢网络做全局调优

  在过去的研究中,科学家已经尝试过各种办法。例如采用穷举试错的办法,对每个遗传元件的代谢功能进行研究,并通过高通量的方法使试错的成本降低。

  这些方法取得不错效果的同时,也需要耗费大量人力、物力和成本,而且绝大部分的操作往往是“无用功”。尤其不幸的是,当需要考虑的代谢网络系统足够复杂时,这些传统的方法便显得“捉襟见肘”,包括实验能力、计算能力、存储能力在内的诸多方面都受到了严峻的挑战。

  另一方面,高产菌株是合成生物学技术研发的核心目标,提高某个特定化合物的产量已达到工业化水平,并取得好的经济效益是科学家和工程师的最重要的目标。

  传统的基因工程或合成生物学方法主要针对产物合成和降解的路径开展,即增强合成途径,削弱和消除分解途径。但是,当产量到一定水平后,尤其是产物合成途径涉及细胞生长相关的关键中间代谢物时,就会遇到瓶颈。

  表示,这意味着应该更多地关注细胞底盘网络对目标代谢途径的承载能力,仅仅关注蛋白的表达是否足够、催化效率是否够高是不够的。因此,需要通过底盘细胞代谢网络的全局调整和优化,来实现产量的进一步提升。SMRP 平台为整个细胞代谢网络的全局调整和优化,提供了新的思路和工具。

  

  图丨智能代谢重编程示意图(来源:Research)

  一方面,该平台可解决合成生物学领域最关心的许多问题,比如生产某种化合物的生产能力,以及生产化合物的过程中的鲁棒性和抗逆性。

  他举例说道:“如果想提高底盘在生产某种有机酸类化合物时生产菌株的耐酸性,我们可以用该平台找到和耐酸相关的敏感节点基因。找到这些节点基因后,直接对相关节点进行组合干预,比如敲除基因和增强基因表达,就可以建立稳定的具备耐酸特性的突变菌株。”

  另一方面,该平台适用于研究基本的生物学问题,比如细菌抗生素耐药性、癌细胞的代谢重编程、基因的高阶相互作和生物学表型的相关性等。“我们的平台为科研工作者提供了一种新方法,通过 SMRP 平台可以得到新的启示和结果。”他说。

  

  另辟蹊径:从基因之间的高阶相互作用入手

  实际上,在研究正式开始之前,该团队已经对解析代谢网络的方法进行了长期的深入思考。既然代谢网络的复杂性太过复杂,短期内还无法对混沌的代谢网络有深彻的认识,那么不如尝试跳出传统的路子,绕开从最底层出发“自下而上”构建代谢网络的障碍。

  于是,该团队提出了一个大胆的假设——直接去找那些能够对代谢产生重要影响的关键基因,并解析它们之间的高阶相互作用规律。

  基于此,该团队基本的设计思路是瞄准细胞感知外界环境的感知基因,并揭示它们的高阶相互作用,直接测定它们相互作用产生的代谢效果。这就不再需要逐个、具体地研究两个基因之间或两个蛋白质之间物理的、直接的相互作用。

  那么,如何来理解基因的高阶的相互作用呢?举例说道:“比如说我们要研究 A 基因和 B 基因在抗生素耐药方面的高阶相互作用,我们去看这两个基因的表达,或者敲除是否会导致抗生素的耐受能力的变化,而不是具体研究这两个基因编码的蛋白质是否会有直接的相互作用。 ”

  他指出:“这种相互作用往往是通过一系列基因的级联响应产生的,跳过直接相互作用通过高阶相互作用的方式,就能够降低研究难度,在更高的维度上对相互作用进行阐释。这种阐释正是我们所需要的,也正是可以方便使用的。”

  

  图丨基于 CRISPRi 的多基因敲弱和甘氨酸上的核糖开关在快速生长的弧菌底盘中的性能(来源:Research)

  SMRP 平台可解码不同感知基因在基因组尺度上的干扰效应,并理性地重编程细胞的全局代谢网络。在论文的研究中,研究人员选择了 35 个组氨酸激酶基因和 24 个甘氨酸代谢相关基因为靶点,测试了该平台在新一代快速弧菌底盘中的有效性,并成功将弧菌的抗生素耐药性降低了 108 倍。

  实际上,高阶相互作用的研究靶点并不是随机选择的,而是在进化的视角下进行选择的,这正体现了 SMRP 平台的“智能性”。解释道:“比如我们之所以选择感知环境的基因,是因为本来它们就分布在细胞的表面,用来感知温度、pH、和特定的化合物刺激,以便细胞能够快速的感知环境变化并及时地调整自己的代谢行为。”

  这些感知环境的基因,其实是在进化中形成的代谢网络的关键调控节点。用它们接受外界的信号来调控自己的行为,对于细胞的生存来说至关重要。然后,细胞就会把这些接受信号之处逐渐进化成为枢纽的关键节点。

  因此,在解析基因相互作用的第一步——筛选节点时,研究团队的基本假设是,任何生物体系感受信号的地方即是其关键枢纽的节点,即“敏感节点”。

  在得到数据后,基因的相互作用通过算法实现解析。“我们设计了一套方法用于统计幸存频率、并通过幸存频率的变化来分析基因的相互作用。在真实环境中,基因相互作用不只是两两互相作用,很可能是三个之间甚至于更多基因之间的共同相互作用。那么,相互作用的推广就需要 AI 神经网络算法的介入,才能够实现从两两互作向多多互作的推广。”介绍说。

  值得关注的是,该研究中运用了数据驱动的理念。也就是说,通过高通量采集数据的方式获得大数据,再通过这些数据分析解读相互作用。这不是传统的实验方法能够匹敌的。“实际上,统计和数据在这个研究中发挥了很大作用, 从数据驱动角度来讲,它代表了一种发展趋势,也是智能的体现。 ”

  

  图丨靶向组氨酸激酶的代谢重编程对溶藻弧菌 FA2 耐药性的干扰作用(来源:Research)

  与以往只能按经验开展的研究相比,通过这种新方法会发现很多意外的现象,帮助更多科研人员和工业界人士发现那些容易被忽视的基因或者基因的相互作用。

  比如,在做抗生素抗性时,该团队发现了一个有趣的现象。在研究两个基因互作对抗生素耐受的影响,分别对它们进行干预时,研究人员意外地发现这会导致抗生素抗性下降,但组合干预时却呈现出强效果。

  “考虑到数据分析方面涉及繁琐的计算和分析,我们把实验设计和分析做成了一站式服务平台,让大家真正可以方便地使用起来,即便是普通的生物学研究生也能很快上手。”说。

  这些开发工具可实现“傻瓜式设计”和“一键式分析”的效果。将想干预的基因集提供给“一站式服务”的网站(https://smrp.sjtu.edu.cn),它就会自动帮助实验人员完成主要的设计。只要把分析数据上传,网站就会返回图文并茂的分析结果。

  据悉,目前该平台已免费对外开放,并提供针对多种重要的微生物提供了预设的实验设计方案,用户可以下载可直接使用,同时只需注册真实的邮箱即可使用定制化服务。并且,相关实验数据仅用户自己可见。

  

  未来有望达到解析百万级基因互作的水平

  “从高阶相互作用入手实现生物代谢网络的理性控制”,这是与其团队本次提出的新理念。他们希望越来越多的人重视高阶相互作用的研究,并尝试这个平台,以突破当前对混沌的细胞代谢的研究困境。

  目前,该平台的应用受到传感器研究的制约,还有很大的提升空间。在提高化合物产量方面,往往缺乏目标化合物的传感器,或者传感器的检测合物的能力有限。未来,该团队也将进一步探索开发针对重要化合物的生物传感器,将平台拓展到更广的应用领域、适应更多不同场景。

  值得关注的是,该团队利用混合引物 PCR 的方法可以高效地构建双 sgRNA 文库,通过合成 n 对引物,就可以构建出针对 n*n 基因对的双 sgRNA 文库。

  “未来,我们希望将这个互作的规模做得更大,把现在对基因干预的规模扩展到全基因组规模。如果我们对其中的 1000 个基因进行互作研究,互作基因对的数目是 1000*1000,就可以达到 100 万的干预规模。”说。

  

  图丨智能代谢重编程概念图(来源:www.smrp.sjtu.edu.cn 网站首页)

  此外,该团队还希望在底盘的多样性方面进行不断扩展。让从事不同领域研究的人都可以使用该平台。他们未来的重点之一是蓝细菌底盘,并将针对蓝细菌开发更多的工具,以及进行工具的优化,比如将工具小型化,以适应更大的基因互作规模。

  实际上,从事合成生物学的科研人员最希望解决难题,就是如何对代谢网络进行理性干预和控制,即达到对代谢网络的可预测、可计算、可设计目标,从而定制细胞代谢网络服务于社会。该研究无疑是向细胞代谢网络的理性控制迈出了重要的一步,期待领域内的更多进展。

  

  参考资料:

  1.Chunlin Tan, Ping Xu, Fei Tao Reasearch(2022). https://spj.science.org/doi/full/10.34133/research.0017

  运营/排版:何晨龙