菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 资讯 > AlphaFold2优化指南:GPT-5.5驱动150小时蛋白质折叠改进实战测评
其他资讯

AlphaFold2优化指南:GPT-5.5驱动150小时蛋白质折叠改进实战测评

2026-05-23
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

开源项目SimplexFold引发关注,其作者包括GPT-5 5。该AI在自主模式下运行超过150小时,尝试改


新智元报道


最近,GitHub上一个名为SimplexFold的开源项目突然火了。原因无他,项目共同作者名单里,赫然出现了“GPT-5.5”这个名字。


据Meta的机器学习工程师、开源社区硬核黑客Chris Hayduk爆料,他让GPT-5.5开启了“全自主目标模式”。在没有人类干预的情况下,这个AI连续不间断地运行了超过150个小时。

它的任务只有一个:扮演一位硅基科学家,去挑战、重构,甚至试图碘伏那个刚刚斩获诺贝尔奖的行业神话——AlphaFold2。


在这场长达数天的“疯狂长跑”中,GPT-5.5展现出了惊人的科研自主性:自己分析论文、自己设计网络拓扑、自己推导几何公式、自己修改PyTorch代码、自己跑训练。


甚至,在遭遇严重过拟合时,它还展现出了连人类专家都难以完全解释的“自发泛化”现象。

诺奖AI的重大缺陷:AlphaFold2到底漏掉了什么?

要理解GPT-5.5为何要对AlphaFold2“开刀”,得先看看这位“行业霸主”留下了什么遗憾。

2024年,AlphaFold2凭借其无可争议的晶体结构预测精度斩获诺贝尔化学奖。它的核心武器是Evoformer模块。


在Evoformer内部,包含了一套强大的“残基对”与“三角形”推理机制。模型把蛋白质的氨基酸残基两两配对,用一个二阶的成对张量来表示它们之间的关系,这在图论里相当于蛋白质的“边”。

著名的“三角更新”机制,则是通过引入第三个残基,来反复校正和增强这些边之间的空间几何一致性。


但是,精妙设计的背后存在一个代价:遗忘。

现有的AlphaFold2在完成极其复杂的三角形计算后,做了一件非常“偷懒”的事——它顺手把计算结果又塞回了那条一阶的“边”里面。也就是说,AlphaFold2内部并没有为一整个完整的三角形面或是四面体单元,维护一个持久的、连续更新的“高阶状态表示”。


这就像一个记忆力只有3秒的工匠,虽然每次砌砖时都会用一把精密的三角尺量一下角度,但量完就把尺子扔了,脑子里记住的依然只有“砖头A和砖头B挨得有多近”。

这,就是AlphaFold2的核心禁区,也是限制其在极微观空间拓扑表达上更进一步的“隐形天花板”。


而GPT-5.5在翻阅了大量生物信息学文献后,敏锐地盯住了这个盲区。SimplexFold项目的核心设问由此诞生:如果我们在神经网络里,直接让模型去学习、维护、更新一整个“三角形面”和“四面体单元”的持久状态,会发生什么?

用数学降维打击生物学复杂性

为了解决这个问题,GPT-5.5引入了一个在近代拓扑学中大放异彩的概念——单纯形。


名字听起来高深,但直观含义非常纯粹:单纯形,就是某个维度里最简单的几何图形。项目主页用一张极其优雅的表格,展示了蛋白质结构是如何被“单纯形化”的。


现有的绝大多数蛋白质神经网络,本质上都是普通的图神经网络。在拓扑学语言里,它们只是一个孤独的“1-骨架”——只有节点和边。

然而,生命不是一根根铁丝拧成的网,生命是丰满的三维实体。蛋白质的折叠和多肽链的缠绕,内部充满了极其苛刻的三体、四体甚至多体物理约束。


如果只用“边”来表达,模型不得不转无数个弯去猜这些高阶特征。但如果引入“单纯形”,情况就不同了。一个“面特征”可以直接理直气壮地描述残基i, j, k组成了一个局部的朝向表面,它的面积和内角系统是怎样的。一个“四面体特征”则可以直接宣告残基i, j, k, l构成了一个紧凑的三维包装核心,它的体积和空间位阻情况如何。


这就是SimplexFold压下的惊天豪赌:通过引入显式的高阶拓扑状态,为神经网络注入极其强大的几何归纳偏置,从而用更少的数据、更优雅的架构,榨干蛋白质主链折叠的最后一丝精度。


自动研究150小时,GPT-5.5究竟改了啥?

以上概念或许有些专业。那么,在这150个小时里,AI到底折腾出了什么硬核优化?

作者Chris Hayduk大方地公开了GPT-5.5的“科研成果”。在原始的设计里,SimplexFold的信息传递路径比较简单:边→面→体→面→重新倒回边和点。


这就好比大家开完会,最后派个代表写个大杂烩简报,把高维信息粗鲁地倒回一维的单体特征里。

而GPT-5.5疯狂加班150小时后,精细化地重构了整个通信路径。它设计了一套“高度结构化的回写机制”。现在,被选中的三角形和四面体在往回传导信息时,不再是“大锅饭”式的倾倒,而是必须严格通过自己真正的边界边进行精准路由。

AI还贴心地加入了几何感知门控和弱三角形注意力提示。这直接把原本粗糙的“传话游戏”,升级成了带有精准导航、具备空间方向感的“高维立体通信网络”。


反转与吃瓜

对于这个炸裂的项目,网上的技术大牛和围观群众立刻展开了讨论。

疑问一:等一下,这个实验图表怎么还带穿越的?

在作者晒出的自主实验进程图中,有眼尖的网友发现了一个诡异的现象:在第80次运行附近,曲线突然“倒流”了,它回到了过去,然后创下了一个比后来还要高的新纪录。


面对这个怪事,大家疯狂猜测。最后得出的结论细思极恐:AI自己给自己开辟新路了。它在推进到某一步时,发现后面的路越走越窄,于是非常理智地回滚到了第80步那个曾经表现不错的历史分叉口,放弃了后面的错误路线,重新开辟了一条新战线。

这在人类科研里太常见了。唯一不同的是,人类要是做实验做了好几天发现错了要推倒重来,那种心理崩溃要痛苦得多。

疑问二:结果其实不太行?

就在大家激动的时候,冷酷的现实给了当头一棒。有人发现,这玩意儿虽然疯狂,但最新的指标结果其实相当糟糕。在这条Y轴上,正牌的AlphaFold分数大概在90左右,而这个SimplexFold差得远呢。别忘了,这模型可是把AlphaFold的论文喂给它训出来的。


所以,闹了半天,最后搞出来的模型性能其实被原生AlphaFold吊打?既然最终的预测结果并不能比肩AlphaFold,那这个疯狂的“150小时实验”失败了吗?

恰恰相反。

几乎所有的一线AI实验室和科学家都给出了相同的答案:这事儿的意义,根本不在于SimplexFold这个模型本身,而是在于“自动研究员”这个范式。


这次实验,是一次极其硬核的概念验证。它证明了高阶逻辑的自洽性,展现了恐怖的样本效率和抗挫折能力,而且是一次低成本的试错。连续150小时,自己给自己debug、看报错、换路线、主动回滚历史分支。这种全自动的实验闭环,一旦配上更强的大模型,进化速度将超出人类想象。

当AI自动研究员全面走向实验室的那一天,或许就是人类探索未知边界的方式被彻底重塑的时刻。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多