其他资讯 AI药物重定向对比

AI药物重定向对比测评：两款顶级科学助手实战解析

2026-05-21

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

《自然》同期发表两篇论文，介绍谷歌Co-Scientist与FutureHouse的Robin两款AI科学助手。它们均采

《自然》杂志最新一期同时刊登了两项突破性研究，展示了AI作为科研助手的强大潜力。谷歌的Co-Scientist系统与非营利机构FutureHouse的Robin系统，均致力于辅助科学家完成从假设生成到验证的关键环节。尽管两者技术路径不同，但都精准地指向了现代科研的核心瓶颈：如何从信息洪流中高效提炼知识。

两款AI科学助手成功完成药物重定位任务

目前，两个系统的验证案例均聚焦于生物医学领域，特别是“药物重定位”这一经典命题，即评估现有药物对全新适应症的潜在疗效。这明确揭示了其现阶段的核心价值：并非替代科学家的创造性思维，而是作为处理超大规模、跨领域文献数据的专用引擎，弥补人类认知的广度局限。

信息过载下的科研范式革新

从架构上看，两者均属于“智能体”范式，通过协调调用多个专用工具模块来完成任务。这与微软等机构的思路不谋而合，而OpenAI则选择了直接对通用大模型进行生物学微调的不同路径。

无论路径如何，其驱动力都源于同一个严峻现实：科学文献的产出速度已远超任何个体研究者的消化能力。学科壁垒使得跨领域的潜在关联极易被忽视——一个在眼科研究中被深入探讨的信号通路，很可能也是肾脏疾病的关键调控者，但分属不同领域的专家往往对此一无所知。

FutureHouse团队将其系统Robin的核心能力概括为“组合综合”，即识别那些跨越传统学科边界、非显而易见的联系，从而摘取那些因知识孤岛而被埋没的“低垂果实”。

这正是AI的用武之地。它能以远超人类的速度，系统性地遍历经过同行评议的文献数据库，将科学家从繁重的信息筛选中解放出来，专注于更需要直觉、批判性思维和实验设计的核心工作。问题的本质不在于AI是否比人“更聪明”，而在于：如果没有AI，这种大规模、系统性的跨领域知识关联挖掘，在现实中几乎不可能完成。

通过建立大量研究间的关联网络，这些工具能够生成关于生物学机制的可行假设，例如推断特定疾病背后的关键通路。在两篇论文的案例中，系统均成功针对特定疾病（急性髓系白血病与黄斑变性）的细胞模型，提出了具有潜在治疗价值的现有药物清单。

谷歌Co-Scientist：基于锦标赛机制的假设进化

谷歌的Co-Scientist系统以其Gemini大语言模型作为核心推理引擎。工作流程始于研究人员定义的研究问题。系统随后进行文献检索，提取信息并生成初始假设池。这些假设随后进入一个“锦标赛”式淘汰赛，由专门的“反思智能体”依据预设标准进行评估。胜出假设再由“进化智能体”进行优化，并进入下一轮迭代，形成闭环。

评估标准严谨且多维，涵盖假设的生物学合理性、科学新颖性、实验可验证性以及潜在生物安全风险。其反思工具能够实时调用外部科学数据库进行事实核查，谷歌指出，这一设计“显著降低了系统产生看似合理实则缺乏依据的‘幻觉’假设的风险”。

该系统特别强调“人在回路”的设计理念。在白血病药物筛选案例中，系统生成的所有候选药物均由专家小组进行最终优先级排序，专家可随时追溯Co-Scientist做出推荐所依据的每一条文献证据链。

实验结果符合肿瘤生物学的复杂性：系统识别出的部分药物对某些白血病细胞系表现出抑制效果，但这种效果具有细胞亚型特异性。这并不意外，因为肿瘤的异质性意味着其生长可能由多条并行通路驱动，阻断其中一条，其他通路仍可能维持细胞增殖。

谷歌透露，该系统具备更广泛的假设生成能力，例如在细菌毒力基因传播研究中的应用，但相关细节未充分展开。系统采用模型无关的架构，便于未来集成更先进的AI模型。同时，团队也坦诚指出了其局限性：“Co-Scientist无法避免其底层大语言模型固有的缺陷，包括事实性错误和幻觉倾向。”

FutureHouse Robin：实现假设生成与实验分析的闭环

FutureHouse的Robin系统与Co-Scientist理念相似，但在关键环节上实现了更深度的自动化。其特色不仅在于为每个工具赋予鸟类代号。Robin配备了专用的文献处理模块：Crow工具生成论文简明摘要，Falcon工具则提供深度综述。效率对比惊人：“Robin在30分钟内可分析551篇论文，而人类专家完成同等工作量预计需要540小时。”

整合文献信息后，Robin针对黄斑变性的病理机制形成了一系列假设，并利用工具对支撑每个假设的证据强度进行梳理。随后，一个大语言模型评判器会对这些假设进行两两比较并排序，其思路与谷歌的“锦标赛”机制类似。

相似的流程也被用于筛选构建疾病模型的最佳细胞系和培养条件，并最终产出针对30种候选药物的详细评估报告。报告不仅阐述了药物可能起效的机制，也明确指出了其潜在的局限与风险。这些报告成为人类专家决策是否进行后续实验的核心依据。

更进一步，Robin还能设计出具体的药物测试实验方案。专家评审后，大多采纳了其方案的调整版本。Robin与Co-Scientist最根本的区别在于其Finch工具：它能自动处理流式细胞术、RNA测序等标准化生物实验产生的数据。这意味着，对于其支持范围内的实验类型，系统能够完成从文献挖掘到实验数据分析的端到端流程。

与谷歌的发现相印证，Robin也提出了一个创新假设：增强视网膜色素上皮细胞清除代谢废物的能力，可能对黄斑变性具有保护作用。在其后续设计的细胞实验中，确实发现了一种能提供此类保护效果的药物候选分子。

专用工具的重要性在此凸显。当团队用通用的OpenAI o4-mini模型替换专用的Crow文献工具时，幻觉引用率从0%飙升至45%。FutureHouse还测试了另一款专注于研究的AI工具，发现该工具额外推荐但未被Robin提及的药物，在后续细胞实验中均未显示活性。

当前定位与未来挑战

必须明确，这些成果目前处于药物研发流程中非常早期的发现阶段。AI在此的角色并非从头设计全新分子，而是从现有药物库中挖掘新用途。大多数药物的失败发生在后期的动物实验和临床试验，而非早期的细胞学测试。这并非贬低药物重定位的价值（其优势在于已知的安全性数据和较低的开发成本），但我们必须清醒认识到，AI距离解决药物研发中最耗资、最不可预测的后期阶段挑战，仍有遥远距离。

此外，“靶向某通路以治疗某疾病”这类假设，在生物学中属于目标相对明确的问题。而在许多前沿探索中，科学家面临的问题往往更为开放和模糊，例如：“一个基因突变为何在多种不同组织中引发表型？其统一的底层机制是什么？”或“在这个关键的基因表达阈值附近，细胞状态究竟发生了何种根本性转变？”目前尚不清楚现有AI系统能否有效应对此类高度开放性的科学谜题。

尽管如此，文献过载是横亘在众多学科面前的切实障碍。为此专门优化的AI系统，有望帮助我们避免“答案早已存在于文献中，却因无人串联而沉寂”的遗憾。令人鼓舞的是，在AI赋能科学的初期，我们已经看到了两套独立开发的系统以不同方式应对同一挑战。未来，同时运行多套系统进行结果交叉验证与对比，其本身就可能成为一种新的科研范式。

Q&A

Q1：谷歌Co-Scientist系统是如何运作的？

该系统以Gemini大模型为核心，启动于科学家输入的研究目标。随后进行自动化文献检索与信息提取，生成初始假设。这些假设进入多轮“锦标赛”式评估与优化循环，由“反思智能体”和“进化智能体”协作筛选、精炼。评估维度包括科学性、创新性、可验证性及安全性。科学家全程参与监督，并对最终输出进行人工审核与决策。

Q2：FutureHouse的Robin系统与Co-Scientist有什么不同？

最关键的差异在于，Robin集成了名为Finch的自动化实验数据分析工具，能够处理流式细胞术、RNA-seq等标准生物实验数据，从而实现了从假设提出到实验验证的更完整闭环。此外，Robin拥有Crow和Falcon等专用文献处理工具，在文献解析的深度与效率上具有显著优势。

Q3：AI科学助手目前能解决哪些问题，局限性在哪里？

当前，这类系统最擅长解决信息过载问题，能高效进行跨领域文献挖掘，为药物重定位等目标明确的研究提出高质量假设。其主要局限有三：第一，更适用于假设验证而非开放探索；第二，细胞水平的成功距离临床疗效验证仍有巨大鸿沟；第三，其性能受限于底层大模型的固有缺陷，如事实准确性不足与“幻觉”问题。

来源：互联网

上一篇 谷歌AI Studio测评：对话式安卓原生应用开发新体验 下一篇 OpenAI与英伟达等巨头采用的Google AI水印技术SynthID深度解析

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。