AI for 科学设计：GFlowNet 和量子计算探索未来

时间：2023-04-15

　　导语

　　随着机器学习和优化算法的广泛应用，人工智能技术正在改变科学研究的方式。AI for Scientific Design 作为一个新兴的研究领域，不仅可以帮助科学家分析大量实验数据，而且可以提供新的方法和工具来建模和预测自然现象。最近，GPT-4 等大模型组成的 AI 智能体，已经可以手把手教你做化学实验了，选啥试剂、剂量多少、推理反应会如何发生，它都一清二楚。那么，AI for Scientific Design 是否将成为科学发现的第五范式，本次读书会将和大家一起讨论这个话题。

　　本次分享由 Mila 的张鼎怀和哈佛大学的扈鸿业共同探讨生成流网络 GFlowNet 和强化学习 RL 在分子设计和量子控制中的应用，并阐述它们如何推动科学设计的突破和发展。

　　AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖（Jure Leskovec 教授指导）、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣（Max Tegmark 教授指导），共同发起以 "AI+Science" 为主题的读书会，从 2023 年 3 月 26 日开始，每周日早上 9:00-11:00 线上举行，持续时间预计 10 周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。

　　简介

　　本次读书会由两部分组成：

　　第一部分，鼎怀将全面综述 GFlowNet 框架。这是一种新的概率机器学习框架，和强化学习同层次，可以应用于实验科学循环的建模、假设生成和实验设计阶段。鼎怀将分享综述性的介绍 GFlowNet 框架，尤其是与现有模型的联系，同时将介绍 GFlowNet 在化学、生物等领域的应用，以及如何更好地将 GFlowNet 方法整合到科学发现流程中，以加速科学发现的步伐并解决全球性问题。

　　第二部分，鸿业将介绍 AI 如何学习和控制量子系统。1980 年代物理学家费曼曾说过 " 如果分子和原子是量子力学所支配的，我们不能用经典计算机来模拟它们，那为什么我们不用量子计算机来模拟它们 " 如何能够让经典的机器学习量子体系，以及量子体系可不可以真正的被经典机器有效的学习是一个重要的问题，深入浅出地给大家讲解经典世界和量子世界的不同，希望能够让大家理解量子力学给我们带来的机遇与挑战。此外，还会给大家简单介绍一些通过强化学习方案实现高精度量子门和设计量子纠错码的工作。

　　分享大纲

　　Part1：GFlowNet for Scientific Design

　　采样问题和科学发现

　　GFlowNet 框架的出发点和系列算法

　　GFlowNet 应用与挑战

　　Part2：量子世界的科学设计

　　AI 如何从世界模型中学习

　　量子世界模型一览、量子计算机

　　如何良好控制和利用量子计算这一 " 性能怪兽 "？

　　重要概念

　　量子态（Quantum State）

　　希尔伯特空间（Hilbert space）

　　投影测量（Projective measurement）

　　变分推断（Variational Inference )

　　量子纠错码（QEC）

　　马尔可夫决策过程（MDP）

　　马尔可夫链蒙特卡罗算法（MCMC）

　　主讲人介绍

　　张鼎怀是 Mila 研究所和蒙特利尔大学的一名在读博士研究生，此前于北京大学数学科学学院获得学士学位。他的研究关注于概率推断和探索方法的结合，包括在推断问题中引入探索机制来帮助采样和生成，以及通过引入结构化概率建模来帮助探索 - 剥削的权衡。他的工作广泛应用于各个机器学习领域，包括强化学习，图片生成，蛋白质设计，小分子合成，组合优化等。他的工作发表在机器学习相关的会议上。

　　个人主页：https://zdhnarsil.github.io/

　　扈鸿业是哈佛量子计划研究员 ( HQI Fellow ) ，主要研究方向是量子计算和 AI 的结合，包括量子模拟与量子体系控制，量子实验噪声抑制，量子纠错码，量子机器学习，量子层析理论，generative model, reinforcement learning。2022 年在加州大学圣地亚哥分校获得物理博士学位（导师尤亦庄教授），2016 年在北京大学获得物理学士学位（导师吴飙教授）。主要研究兴趣为量子计算，变分量子算法，量子态层析理论，生成型神经网络与无监督学习，强化学习，量子纠错码，量子多体物理，量子最优控制理论等。博士期间曾获得 UCSD 物理系挑战奖，NASA-USRA 费曼奖学金，幺正基金 ( unitary fund ) 奖金。

　　个人主页：https://scholar.harvard.edu/hongyehu

　　直播信息

　　直播时间：

　　2023 年 4 月 16 日（周日）晚上 21:00-23:30

　　参与方式：

　　扫码参与读书会，加入群聊获取本系列读书会的视频回放权限、资料权限，与社区的一线科研工作者和企业实践者沟通交流。

　　概念剖析

　　GFlowNet 框架

　　GFlowNet 框架，是一种新的概率机器学习框架，可以应用于实验科学循环的建模、假设生成和实验设计阶段。在探索大型搜索空间的挑战方面，GFlowNet 通过学习从奖励函数间接给出的分布中采样来解决这个问题。这个奖励函数对应于一个非归一化概率，使得 GFlowNet 能够采样多样化、高奖励的候选方案。此外，作为一种基于网络学习的新型采样方法，GFlowNet 还可以从数据中学习复杂系统的潜在因果结构，并用于生成新的有价值的候选样本。

　　图 1：这张图展示了为什么在 GFlowNet 中使用 " 流 " 这个词。| 图片来源：Flow Network based Generative Models for Non-Iterative Diverse Candidate Generation

　　目前机器学习方法面临的一个关键挑战是如何有效地探索非常大的搜索空间，这需要有估计可减少（认知层面上的）不确定性的技术，并生成多样化和信息丰富的实验集。GFlowNet 就是为应对这一挑战而生的。它可以用于实验科学循环的建模、假设生成和实验设计阶段。

　　图 2：使用 GFlowNets 促进科学发现的迭代实验循环。| 图片来源：GFlowNets for AI-Driven Scientific Discovery

　　GFlowNet 通过学习从奖励函数给出的分布中取样，从而可以对不同的、高回报的候选者进行采样。同时，GFlowNet 也可以形成高效和摊销的贝叶斯后验估计器，以已获得的实验数据为条件的因果模型。有了这样的后验模型，就可以提供认知层面上的不确定性和信息增益的估计，从而推动实验设计政策。GFlowNet 可作为人工智能驱动科学发现的有价值工具，尤其是在面临非常大的候选空间情况下，可以获得廉价但不准确的测量，或昂贵但准确的测量。

　　量子体系和经典体系的辨析

　　想象一下，你正在玩一个赌博游戏，你抛硬币并猜测结果。在经典体系中，这个结果可以是正面或反面，且我们可以通过经典的物理法则来预测和计算可能的结果和概率。但是，在量子体系中，硬币不再是一个简单的二元选择，而是存在多个可能性状态的叠加。我们无法通过经典物理来预测硬币翻转的确切结果，而是需要使用量子力学的工具来描述和计算。

　　图 3：量子计算到底跟经典计算有什么不同？| 图片来源：墨子沙龙

　　要想使得人工智能能够操纵量子体系，首先我们需要思考基于经典机器的人工智能体系能不能有效的学习和理解量子态。经典和量子体系有哪些不同？经典的机器学习方法在解决量子问题上又有机遇与挑战？本期读书会，我们将简单介绍关于随机测量的量子 - 经典接口方案的前沿结果，以及一些利用这个测量方案进行机器学习并发现量子物相的工作。对于量子体系的控制，制备高精度的量子门，发现更好的量子纠错码，是通往可纠错量子计算并实现量子优势的必经之路。在最后，我们会给大家简单介绍一些通过强化学习方案实现高精度量子门和设计量子纠错码的工作。

　　推荐学习资源

　　关于 GFlowNet 的前置知识

　　生成流网络（GFlowNet）是由图灵奖得主 Yoshua Bengio 提出的人工智能未来方向之一。GFlowNet 是一种新的概率机器学习框架，旨在通过探索大的搜索空间和通过贝叶斯后验估计器来降低（认知层面上的）不确定性，从而改善科学发现。在 2021 年，Bengio 以一作身份发表了长达 70 页的论文《GFlowNet Foundations》，详细介绍了 GFlownet 的研究。

　　图 4：如何条件化 GFlowNet，在给定状态 s 下，通过原始流（左）和转移流来创建一组新的流（右）。| 图片来源：GFlowNet Foundations

　　去年，Bengio 及其学生张鼎怀等发表了一篇新论文《Unifying Generative Models with GFlowNets》，简要介绍了现有深度生成模型与 GFlowNet 框架之间的联系，并通过马尔可夫轨迹学习的视角提供了一个统一的观点，并进一步提供了一种统一训练和推理算法的方法。

　　关于量子计算的基础课程

　　加大圣迭戈分校：量子力学（英文 -2021）

　　来自加州大学圣地亚哥分校的助理教授尤亦庄从量子比特开始谈起，逐一介绍了量子力学的五大公理（量子态，观测量，量子测量，时间演化，多体系统），循序渐进地建立量子力学的基本概念和体系。在此基础上，课程着重探讨了量子纠缠，量子测量和量子纠错等量子信息学的入门知识。

　　量子信息预读班

　　在集智 - 凯风研读营项目的支持下，集智俱乐部组织了量子信息预读班，主要聚焦在量子计算领域，对量子线路的经典模拟、量子计算与人工智能的交叉、量子模拟、量子噪声理论与纠错码等方面的论文进行研读与讨论。希望能通过预读班的形式，能够吸引具有基本物理基础且对量子计算感兴趣的人（例如本科生）和量子计算的年轻研究员，研读硬核论文，激发科研灵感。

　　集智推文

　　量子计算机如何重塑人类未来：十个跨学科应用

　　量子计算：信息社会的未来

　　量子计算：帮助理解自然的最小组成部分 | 量子世界地图

　　不确定因果：当因果遇到量子

　　推荐的 GFlowNet 学习路径和资源：

　　https://github.com/zdhNarsil/Awesome-GFlowNets

　　AI+Science 读书会启动

　　AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science，机器学习和其他 AI 技术可以用来解决科学研究中的问题，从预测天气和蛋白质结构，到模拟星系碰撞、设计优化核聚变反应堆，甚至像科学家一样进行科学发现，被称为科学发现的 " 第五范式 "。另一方面是 Science for AI，科学尤其是物理学中的规律和思想启发机器学习理论，为人工智能的发展提供全新的视角和方法。

　　集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖（Jure Leskovec 教授指导）、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣（Max Tegmark 教授指导），共同发起以"AI+Science" 为主题的读书会，探讨该领域的重要问题，共学共研相关文献。读书会从 2023 年 3 月 26 日开始，每周日早上 10:00-12:00 线上举行，持续时间预计 10 周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。

　　详情请见：

　　人工智能和科学发现相互赋能的新范式：AI+Science 读书会启动

　　点击 " 阅读原文 "，报名读书会