打破任务孤岛壁垒,清华王童团队揭示AI药物分子互作统一建模
摘要
在药物研发与临床用药决策中,精准预测药物相互作用(DDI)及药物-靶点相互作用(DTI)
在药物研发与临床用药决策中,精准预测药物相互作用(DDI)及药物-靶点相互作用(DTI)始终是核心难题。微观层面上,药物分子如何与体内靶点结合,直接决定联合用药是引发毒性还是产生协同效应。与此同时,AI技术——尤其是图神经网络与大型语言模型——近年取得突破性进展,正迎来广泛应用窗口。然而,该领域长期面临一个尴尬局面:DDI与DTI预测模型如同两座孤岛,各自独立发展,很少考虑两者在底层生物学机制与算法设计上的内在关联。

2026年5月29日,清华大学生命学院王童课题组在《Advanced Science》发表重磅综述,标题直指核心:How Advanced Artificial Intelligence Technologies Shape Drug–Drug and Drug–Target Interaction Modeling。该综述并未简单罗列算法,而是从生物学机理出发,系统梳理了药物相互作用领域的共性演化趋势。更重要的是,团队设计了一套全新的定量实验方法,正面审视当前先进AI预测模型的核心瓶颈,并为构建统一模型指明方向。
DDI与DTI的共性演化路径
综述全面分析了近40个近年来的先进DDI与DTI预测算法,发现两者在特征工程、模型架构与学习范式上的演化路径高度一致,几乎同步推进。特征工程方面,两者从最初仅关注单一分子结构或序列输入,进化为整合多模态信息的生物医学知识图谱——不再只分析药物分子结构,还需兼顾其相互作用邻居、通路角色及疾病关联。模型架构上,图神经网络与Transformer已成为标配:前者捕捉局部特征,后者处理全局依赖,形成互补。学习范式层面,元学习、对比学习、集成学习等新方法受到更多关注——不再简单投喂数据训练,而是注重学习策略的智能化与抗过拟合能力。
繁荣表象下的核心挑战
为检验模型真实能力而非花架子,综述直接抛出几个尖锐挑战。首先是泛化能力。实验表明,现有AI模型在“暖启动”任务中(训练数据与测试数据随机混洗,共享部分药物与靶点)表现不俗,准确率较高。但切换到“冷启动”模式——要求模型预测训练数据中完全未见的新药或新靶点——多数高精度模型性能显著下降。数据稀疏性依然是制约模型走出舒适区、进入更广阔化学空间的最大障碍。

图1: 冷启动场景示意图及DDI与DTI预测任务中冷/暖启动场景模型性能对比。a-b, DDI与DTI冷启动划分策略;c-d,DDI预测冷/暖启动性能对比;e-f,DTI预测冷/暖启动性能对比。
其次,数据标准化问题同样突出。通过比对各类常用公共数据集,研究团队发现领域内缺乏统一的数据预处理规范与标准,导致同一数据集在不同研究中样本规模差异巨大。这为客观公正地比较算法性能埋下了系统性偏差。

图2: DDI预测任务数据集样本规模差异。a,药物数量分布;b,药物互作对数量分布。
突破口:捷径学习的实证检测
更关键的发现是,研究团队通过精心设计的对照实验,揭开了当前预测模型普遍存在的“投机取巧”行为——捷径学习。为检验模型是否真正学会分子间物理化学结合法则,他们设计了一套“自配对伪负样本实验”:统计每个药物和每个靶点出现的阳性标签率,并分别为每种药物与靶点构建〈药物,药物〉及〈靶点,靶点〉的自配对伪样本,观察模型在仅接触单方实体信息时是否会轻易下结论。结果触目惊心:多种不同架构的深度学习模型均表现出明显的捷径学习倾向——模型更倾向于记住训练数据中阳性标签频率更高的药物或靶点,按照“实体流行度”给互作概率打分,而非真正理解分子间的结合机制。

图3: 捷径学习验证实验。a-f,多项不同架构的预测模型产生捷径学习倾向,模型倾向于向阳性标签频率更高的药物或靶点赋予更高的互作概率。
未来的路该怎么走
在将新旧问题全部摆上台面后,文章给出三个明确方向。第一,必须打破任务孤岛格局:未来预测架构应实现DDI与DTI任务的联合协同优化,共享统一的底层药物与蛋白质编码器,达到知识互通。第二,需将因果推断机制融入表征学习网络,结合机器学习力场等物理约束,推动模型学习真正可靠的物理因果关系,而非依赖统计相关性蒙混过关。第三,充分利用前沿大语言模型,从非结构化的临床报告、科研论文乃至失败实验记录中提取隐藏的药物关联,补全结构化数据。只有从根源上解决数据不足与分布偏斜问题,模型才能真正突破局限,走向实际应用。
参考资料
X.Sun and T.Wang, “How Advanced Artificial Intelligence Technologies Shape Drug–Drug and Drug–Target Interaction Modeling.” Advanced Science (2026): e75819.
https://doi.org/10.1002/advs.75819
代码
https://github.com/WangGroup-AI/AI4DrugInteraction
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。