其他资讯人工智能 AGI发展趋势权威

AGI发展趋势权威测评：7大维度深度解读通用人工智能

2026-06-02

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

谷歌数据中心深处，一个名为AlphaEvolve的AI系统悄悄干了件大事——它自主设计出一套全新

谷歌数据中心深处，一个名为AlphaEvolve的AI系统悄悄干了件大事——它自主设计出一套全新算法，将关键计算内核的速度直接拉升了23%，还顺手破解了一个困扰数学家半个世纪的矩阵乘法难题。但与此同时，Apple实验室的报告却爆出另一番景象：面对复杂版的“河内塔”推理测试，主流AI模型的准确率突然断崖式下跌，几乎归零，最后干脆“摆烂”随机作答。

这两幅画面搁在一起看，才是通用人工智能研究最真实的写照：一边是天花板被捅破的惊艳，一边是连基础逻辑都扛不住的尴尬。

01 当“万能”成为关键词

通用人工智能（AGI）要干的事，说白了就是造出一个能像人一样跨领域学习、推理和创造的系统。它和现在那堆狭窄人工智能最大的区别在于——面对一个没练过的全新问题，它能自己想办法解决，而不是直接“报错”。

具体来说，ChatGPT写文章写得再溜，AlphaFold预测蛋白质结构再准，这些说到底都是特定场景下的“专精选手”。真正的AGI，应该是你教会它开车之后，它能自然地把空间感知和机械原理那套东西迁移过来，顺手帮你修修汽车引擎。这才是“通用”二字的真正分量。

DeepMind的科学家们把这个愿景提炼成了“世界模型”——说白了，就是让AI建立一套对物理和社会规律的隐式理解，让它不仅能看懂这个世界，还能预测甚至干预现实。

02 技术瓶颈：从“摆烂”到因果推理的鸿沟

Apple那份《思考的幻象》报告，把当前大模型的底裤都扒干净了。报告显示，在中等难度的逻辑谜题面前，主流模型虽然能给出正确答案，但计算资源的消耗已经高得离谱；一旦问题复杂度再往上提一档，准确率直接断崖式下跌，趋近于零，模型干脆切换到“随机猜测”模式来糊弄人。

这种现象背后，藏着两大硬伤：一个是因果推理能力的缺失，另一个是持续探索能力的不足。18世纪哲学家休谟早就点过题——人类是通过经验归纳来建立因果认知的，而现在的AI呢，只会傻乎乎地学习数据里的统计关联，根本搭不起真正的因果链条。这就是本质差距所在。

值得留意的是，蚂蚁集团的AGI专项基金已经把强化学习列为重点攻关方向，试图通过Agentic RL技术让AI获得自主探索环境的能力。前谷歌工程总监毕树超说得更直白：“实现AGI的关键在于提升数据智能密度，而不是简单地把模型做大。”这话听着就很有分量。

03 接近边界，还是本质不同？

DeepMind的AlphaEvolve确实展示了AI超越人类的潜力：它设计的调度算法把谷歌全球算力利用率提了0.7%，还在“亲吻数问题”上找到了593球体的配置方案，直接破了牛顿时代留下的数学记录。听起来很震撼，但仔细看过程，差异就出来了。

AlphaEvolve的优化靠的是25000次自动迭代测试，硬生生堆出来的。而人类数学家呢？可能只是一次灵光乍现，问题就解决了。哥伦比亚大学的研究也点出了这个区别：人类大脑有跨模态知识融合的天赋——婴儿摸一下火炉，再看一眼火焰，就能建立起“高温危险”的泛化认知。而AI要达到同样的理解，得靠海量标注数据和复杂的多模态对齐训练。

这背后不是量的问题，是质的区别。

04 失控创新下的安全框架

当AI开始设计核电站控制算法、参与医疗诊断系统时，算法偏见就不再是学术问题了——它可能直接演变成系统性歧视，甚至是致命的错误。这不是危言耸听，现实正在逼近。

2023年发布的ISO/IEC 42001标准首次建立了全生命周期的AI风险管理框架，要求对训练数据偏见和模型决策透明度做持续审计。欧盟的《人工智能法案》直接把AGI研发列入了“高风险”类别，中国则通过《网络安全法》要求关键领域的AI系统必须做到决策过程可追溯。蚂蚁集团在开源百灵大模型时，也同步发布了动态评测工具包，用来持续监控模型输出中的价值观偏移。

安全框架的搭建，已经跟技术研发同步跑起来了。

05 从算力竞赛到认知革命

截至2025年，全球大模型数量已经达到3750个，其中中国贡献了1509个，占比40%，领跑全球。DeepMind的Genie 3则代表了一种技术突破——通过文本提示就能生成720p/24fps的交互式3D世界，并且能维持物理一致性长达数分钟。这意味着“数字孪生”训练场正在成为现实。

技术路线上，正呈现出两条并行跑道：一边是OpenAI等机构坚持Scaling Law，预测万亿参数模型将在2028年出现；另一边是Meta、蚂蚁集团在探索高效注意力机制，试图用算法革新替代算力堆砌。

PwC的预测数字也很有意思：到2035年，AI将贡献20万亿美元的全球经济价值，其中AGI技术的占比将超过60%。这个盘子，足够大。

06 中美双极下的生态竞争

全球AGI竞赛的地域特征已经非常清晰。美国这边，Google的Gemini系列、OpenAI的GPT体系、Meta的Llama生态是技术先驱，Anthropic则在专注构建宪法AI的安全护栏。中国这边，百度文心、阿里通义千问、腾讯混元构成了核心平台，实在智能等初创企业则在深耕垂直领域的Agent应用。

非营利组织方面，中国人工智能学会与蚂蚁集团共建的AGI科研基金，已经聚焦27项关键技术课题。高校层面，MIT-斯坦福-剑桥和清华-浙大-上海交大形成了双创新轴心，后者已经与蚂蚁集团建立了联合实验室，推进多模态交互研究。

生态竞争的本质，拼的是谁能更快把技术从实验室推向产业。

07 语言游戏中的存在之问

维特根斯坦在《哲学研究》里提出的语言游戏理论，现在看来简直是审视AGI局限的一把锋利手术刀。当AI流畅地生成莎士比亚风格的诗歌时，它实际上是在玩一场统计符号组合的游戏——它并不理解“爱情”和“死亡”这些词语在人类经验中的真实分量。

休谟对因果关系的质疑同样适用。人类是基于情感体验建立价值判断的，而AI的伦理选择，说到底还是在做概率计算。这就引出了一个终极问题：AGI到底需不需要复刻人类意识？

DeepMind的研究员在Genie 3的论文中给出了一个很有意思的暗示：世界模型的物理一致性，可能会催生机器独有的认知范式——通过万亿次传感器交互形成对重力、摩擦力的“理解”，这种理解的本质，跟人类的具身体验完全不同。

当AlphaEvolve在矩阵乘法领域超越人类数学家时，工程师发现它的算法核心仍然是张量运算，而不是什么灵感迸发。当Genie 3构建的虚拟山脉中突然出现鹿群，这些数字生物的运动轨迹依然遵循着预设的物理参数，跟自由意志没有半点关系。

说到底，AGI探索的终点或许根本就不是复刻人类心智，而是创造一种理解世界的新范式。这才是整个故事最让人兴奋的部分。

来源：互联网

上一篇 Excel文件崩溃修复：4种方法专业测评 下一篇 折叠屏iPhone本月量产，价格刷新苹果纪录深度测评

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。