Summary: 本文提出 LLM-Syn-Planner 框架,通过直接生成并优化多步逆合成路径,显著提升大型语言模型在逆合成规划中的表现,并成功扩展到可合成分子设计问题。
Keywords: LLM, Retrosynthesis, Molecular Design, Evolutionary Search, Planning
Authors: Haorui Wang, Jeff Guo, Lingkai Kong, Rampi Ramprasad, Philippe Schwaller, Yuanqi Du, Chao Zhang
Institution(s): Georgia Tech, École Polytechnique Fédérale de Lausanne (EPFL), National Centre of Competence in Research (NCCR) Catalysis, Harvard University, Cornell University
Problem Background
逆合成(Retrosynthesis)规划是有机化学和药物开发中的核心问题,旨在将目标分子分解为可购买的前体分子,但由于合成路径的搜索空间随反应步骤呈指数增长,传统单步预测模型和搜索算法难以高效解决多步规划问题。 近年来,大型语言模型(LLMs)展现出化学知识和复杂决策潜力,但其在高度约束的逆合成任务中的应用仍未被充分探索,作者希望利用 LLMs 的生成和规划能力,解决逆合成规划及更广泛的可合成分子设计挑战。
Method
- LLM 作为单步预测模型: 将 LLM 集成到传统搜索算法(如 Monte Carlo Tree Search 或 Retro*)中,用于预测每一步的反应模板或反应物。
- 由于 LLM 难以直接输出反应概率,作者通过‘自我一致性频率’方法为预测分配伪概率,即采样多次独立反应并计算频率作为概率估计。
- 结合参考反应数据库,通过检索避免虚构反应模板,确保化学可行性。
- LLM-Syn-Planner(进化搜索算法): 这是核心创新,直接利用 LLM 生成完整的多步合成路径,并通过进化算法优化。
- 初始化(Initialization): 基于目标分子,通过分子相似性(Morgan 指纹和 Tanimoto 相似性)检索参考路径,提供给 LLM 生成初始路径池。
- 评估(Evaluation): 设计三级反馈机制(分子级别:验证分子有效性和可购买性;反应级别:匹配数据库验证反应可行性;路径级别:检查路径连通性),评估每一步质量。
- 选择(Selection): 引入部分奖励机制(基于 SC 分数评估无效步骤的分子集),选择适应度最高的路径进入下一轮。
- 变异(Mutation): 利用 LLM 修改无效步骤,结合评估反馈和参考路径,生成新的候选路径,重复迭代直至找到解或达到预算。
- 采用线性格式表示合成路径,降低树形结构的复杂性,并引入‘Rational’推理组件,鼓励 LLM 在决策前思考,提升一致性。
- 扩展到可合成分子设计: 提出 LLM-Syn-Designer,结合分子优化工具(如 MolLEO),在优化分子属性的同时通过 SC 分数过滤确保可合成性,形成端到端设计框架。
Experiment
- 逆合成规划: 在 USPTO 和 Pistachio 数据集上,LLM 作为单步预测模型时,解决率远低于传统模型(如 Graph2Edits, LocalRetro),尤其在困难数据集(如 Pistachio Hard)上接近于零;而 LLM-Syn-Planner 表现突出,解决率接近甚至超过传统方法(如 USPTO Easy 上达 93%-100%),表明直接生成并优化完整路径更适合 LLMs。
- 可合成分子设计: LLM-Syn-Designer 在优化分子属性(如 JNK3, GSK3B)时,相比传统方法(如 Graph-GA, REINVENT),在更少的 oracle 调用下达到类似或更高的适应度分数,同时保证了可合成性。
- 消融研究: 线性路径格式显著优于树形格式(成功率提升至 91%);分子 RAG 即使提供随机参考路径也能提升性能(成功率从 51% 提升至 84%);部分奖励机制对长距离决策至关重要(成功率从 63.5% 提升至 91%);提示设计中的解释性部分进一步提升表现。
- 实验设置合理性: 数据集涵盖不同难度,基线模型包括多种传统方法,实验限制(如 60 分钟搜索时间)确保公平性,数据表明 LLM-Syn-Planner 的提升显著,尤其在完整路径规划上的突破。
Further Thoughts
线性路径格式显著降低了合成路径复杂性,启发在其他树形搜索问题中尝试类似简化表示;部分奖励机制对 LLM 长距离决策至关重要,可在其他序列决策任务中设计中间反馈;检索增强生成(RAG)即使提供随机参考路径也能提升性能,表明其价值在于上下文范例,可在代码生成或知识推理中探索;进化搜索与 LLM 结合展现强大生成与优化能力,未来可应用于材料约束合成规划或其他多目标优化问题。