菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 资讯 > AGI发展趋势权威测评:7大维度深度解读通用人工智能
其他资讯 人工智能 AGI发展趋势权威

AGI发展趋势权威测评:7大维度深度解读通用人工智能

2026-06-02
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

谷歌数据中心深处,一个名为AlphaEvolve的AI系统悄悄干了件大事——它自主设计出一套全新

谷歌数据中心深处,一个名为AlphaEvolve的AI系统悄悄干了件大事——它自主设计出一套全新算法,将关键计算内核的速度直接拉升了23%,还顺手破解了一个困扰数学家半个世纪的矩阵乘法难题。但与此同时,Apple实验室的报告却爆出另一番景象:面对复杂版的“河内塔”推理测试,主流AI模型的准确率突然断崖式下跌,几乎归零,最后干脆“摆烂”随机作答。

这两幅画面搁在一起看,才是通用人工智能研究最真实的写照:一边是天花板被捅破的惊艳,一边是连基础逻辑都扛不住的尴尬。

01 当“万能”成为关键词

通用人工智能(AGI)要干的事,说白了就是造出一个能像人一样跨领域学习、推理和创造的系统。它和现在那堆狭窄人工智能最大的区别在于——面对一个没练过的全新问题,它能自己想办法解决,而不是直接“报错”。

具体来说,ChatGPT写文章写得再溜,AlphaFold预测蛋白质结构再准,这些说到底都是特定场景下的“专精选手”。真正的AGI,应该是你教会它开车之后,它能自然地把空间感知和机械原理那套东西迁移过来,顺手帮你修修汽车引擎。这才是“通用”二字的真正分量。

DeepMind的科学家们把这个愿景提炼成了“世界模型”——说白了,就是让AI建立一套对物理和社会规律的隐式理解,让它不仅能看懂这个世界,还能预测甚至干预现实。

02 技术瓶颈:从“摆烂”到因果推理的鸿沟

Apple那份《思考的幻象》报告,把当前大模型的底裤都扒干净了。报告显示,在中等难度的逻辑谜题面前,主流模型虽然能给出正确答案,但计算资源的消耗已经高得离谱;一旦问题复杂度再往上提一档,准确率直接断崖式下跌,趋近于零,模型干脆切换到“随机猜测”模式来糊弄人。

这种现象背后,藏着两大硬伤:一个是因果推理能力的缺失,另一个是持续探索能力的不足。18世纪哲学家休谟早就点过题——人类是通过经验归纳来建立因果认知的,而现在的AI呢,只会傻乎乎地学习数据里的统计关联,根本搭不起真正的因果链条。这就是本质差距所在。

值得留意的是,蚂蚁集团的AGI专项基金已经把强化学习列为重点攻关方向,试图通过Agentic RL技术让AI获得自主探索环境的能力。前谷歌工程总监毕树超说得更直白:“实现AGI的关键在于提升数据智能密度,而不是简单地把模型做大。”这话听着就很有分量。

03 接近边界,还是本质不同?

DeepMind的AlphaEvolve确实展示了AI超越人类的潜力:它设计的调度算法把谷歌全球算力利用率提了0.7%,还在“亲吻数问题”上找到了593球体的配置方案,直接破了牛顿时代留下的数学记录。听起来很震撼,但仔细看过程,差异就出来了。

AlphaEvolve的优化靠的是25000次自动迭代测试,硬生生堆出来的。而人类数学家呢?可能只是一次灵光乍现,问题就解决了。哥伦比亚大学的研究也点出了这个区别:人类大脑有跨模态知识融合的天赋——婴儿摸一下火炉,再看一眼火焰,就能建立起“高温危险”的泛化认知。而AI要达到同样的理解,得靠海量标注数据和复杂的多模态对齐训练。

这背后不是量的问题,是质的区别。

04 失控创新下的安全框架

当AI开始设计核电站控制算法、参与医疗诊断系统时,算法偏见就不再是学术问题了——它可能直接演变成系统性歧视,甚至是致命的错误。这不是危言耸听,现实正在逼近。

2023年发布的ISO/IEC 42001标准首次建立了全生命周期的AI风险管理框架,要求对训练数据偏见和模型决策透明度做持续审计。欧盟的《人工智能法案》直接把AGI研发列入了“高风险”类别,中国则通过《网络安全法》要求关键领域的AI系统必须做到决策过程可追溯。蚂蚁集团在开源百灵大模型时,也同步发布了动态评测工具包,用来持续监控模型输出中的价值观偏移。

安全框架的搭建,已经跟技术研发同步跑起来了。

05 从算力竞赛到认知革命

截至2025年,全球大模型数量已经达到3750个,其中中国贡献了1509个,占比40%,领跑全球。DeepMind的Genie 3则代表了一种技术突破——通过文本提示就能生成720p/24fps的交互式3D世界,并且能维持物理一致性长达数分钟。这意味着“数字孪生”训练场正在成为现实。

技术路线上,正呈现出两条并行跑道:一边是OpenAI等机构坚持Scaling Law,预测万亿参数模型将在2028年出现;另一边是Meta、蚂蚁集团在探索高效注意力机制,试图用算法革新替代算力堆砌。

PwC的预测数字也很有意思:到2035年,AI将贡献20万亿美元的全球经济价值,其中AGI技术的占比将超过60%。这个盘子,足够大。

06 中美双极下的生态竞争

全球AGI竞赛的地域特征已经非常清晰。美国这边,Google的Gemini系列、OpenAI的GPT体系、Meta的Llama生态是技术先驱,Anthropic则在专注构建宪法AI的安全护栏。中国这边,百度文心、阿里通义千问、腾讯混元构成了核心平台,实在智能等初创企业则在深耕垂直领域的Agent应用。

非营利组织方面,中国人工智能学会与蚂蚁集团共建的AGI科研基金,已经聚焦27项关键技术课题。高校层面,MIT-斯坦福-剑桥和清华-浙大-上海交大形成了双创新轴心,后者已经与蚂蚁集团建立了联合实验室,推进多模态交互研究。

生态竞争的本质,拼的是谁能更快把技术从实验室推向产业。

07 语言游戏中的存在之问

维特根斯坦在《哲学研究》里提出的语言游戏理论,现在看来简直是审视AGI局限的一把锋利手术刀。当AI流畅地生成莎士比亚风格的诗歌时,它实际上是在玩一场统计符号组合的游戏——它并不理解“爱情”和“死亡”这些词语在人类经验中的真实分量。

休谟对因果关系的质疑同样适用。人类是基于情感体验建立价值判断的,而AI的伦理选择,说到底还是在做概率计算。这就引出了一个终极问题:AGI到底需不需要复刻人类意识?

DeepMind的研究员在Genie 3的论文中给出了一个很有意思的暗示:世界模型的物理一致性,可能会催生机器独有的认知范式——通过万亿次传感器交互形成对重力、摩擦力的“理解”,这种理解的本质,跟人类的具身体验完全不同。

当AlphaEvolve在矩阵乘法领域超越人类数学家时,工程师发现它的算法核心仍然是张量运算,而不是什么灵感迸发。当Genie 3构建的虚拟山脉中突然出现鹿群,这些数字生物的运动轨迹依然遵循着预设的物理参数,跟自由意志没有半点关系。

说到底,AGI探索的终点或许根本就不是复刻人类心智,而是创造一种理解世界的新范式。这才是整个故事最让人兴奋的部分。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多