高通Computex重磅:边缘计算vs终端计算,终极对决
摘要
未来几年,你的手机可能会被两个人同时使用。一个是你——浏览应用、查阅消息、处理邮
未来几年,你的手机可能会被两个人同时使用。一个是你——浏览应用、查阅消息、处理邮件;另一个是你的AI智能体——在后台管理日程、调用工具、执行任务,有时还会替你操作同一台设备。
这两年,谈及AI,许多人首先想到的还是那个聊天框:打开网页,输入问题,等待回答。智能体彻底颠覆了这个模式——它不再等待你每次主动提问,而是持续待命,自主拆解任务、调用工具、执行流程,完成后才回来向你确认。
AI从“你去用它”进化为“它替你做事”,最先被重塑的很可能就是计算本身:计算在哪里运行、在哪里感知、在哪里决策,又在哪里产生成本。这正是高通CEO安蒙在6月1日Computex 2026开幕主题演讲上试图解答的问题。他给出的答案,是一条从耳机延伸到数据中心的“计算连续体”——让计算分散到各处去发生。
AI开始在你身边常驻
要理解这个连续体,必须先弄清楚它要承载的是一种什么样的AI。
越来越多的人已经在提前体验这一转变。他们在家里放置一台永不关机的迷你电脑,全天候运行着OpenClaw这类智能体,人不在家,通过一个聊天框给它发指令,让它查询资料、编写代码、完成杂务。安蒙在台上也提到了这个现象。这虽然是偏极客的玩法,但它把一个普通人迟早会遇到的问题提前摆在了眼前——智能体要自主工作,就必须有一个全天候待命的运行环境。
过去的软件是你去用它:打开应用、输入指令、等待回应,所有操作由人发起。智能体彻底改变了这套逻辑——它全天候在线,持续记录上下文,能自主将一个目标拆解为多个步骤,在不同的系统与数据之间调度,在你没有盯着的时候把活干完,干完再回来与你确认。
这就引出一个容易被忽略的变化:同一台设备会开始扮演两个角色。一个是你操作它——这是今天所有设备的设计前提;另一个是智能体自主操作它——这会是明天的常态。两件事同时压在一台手机上发生,对硬件是实实在在的新挑战。光是你自己使用,续航撑一天都费力,再叠加一个全天候运行的智能体,功耗和时延立刻成了绕不开的工程难题。
而今天大多数设备,并非为这种AI从头设计。硬件和系统都围绕“用户主动操作”搭建起来,与一个会自主行动的智能体并不匹配。高通把这个转变概括为:数字生活的中心正从手机转移到智能体身上。手机的角色也随之变化——它过去是所有数字体验的唯一中心,如今降级为智能体网络中的一个节点,各类设备则围绕智能体运转,成为它触达用户和现实世界的端点。
因此,一批更适合智能体的新设备正在涌现,比如贴着你眼睛、耳朵和嘴的智能眼镜。把这些都算上,端点的规模相当可观——全球几十亿部手机、二十亿台从可穿戴演进而来的个人AI终端、二十亿台PC,再加上数亿辆智能网联汽车。这场硬件层面的改造,不是小修小补能应付的。
常驻的智能体,住不进单一的云
接下来的问题顺理成章:这么一个常驻、高频且需要跨服务运行的智能体,能否完全塞进云端?云当然能扛,只是把什么都堆上去,在成本、时延、隐私和情境感知上都不是最优解。
先看成本。高通把AI的演进拆成三个阶段来算这笔账。最早的对话式AI是单轮问答,一次交互大约消耗一万个token;到了能多轮推理的阶段,单个任务涨到十万;再到能自主调用工具、连续执行多步的智能体,单任务冲上百万量级。短短两代,单任务的token消耗放大了约一百倍。再乘上全球设备全天候地运行,总量到2030年将庞大到难以想象——高通的说法是那时每十秒产生的token就要按万亿计,安蒙在台上甚至调侃,这个数大得他都不知道该怎么念。
成本怎么省?高通用一个贴近开发者的例子展示了出来:跑一个真实的Claude Code编程任务,让规划器把一部分留在设备本地计算、必要的部分才送上云,在结果一样的前提下,省下约一百四十万个token,成本降低了六成。也有分析机构测算过,纯云端模式在十亿级用户规模上持续服务,成本和可扩展性都会触到天花板。账还不只在钱上——实时性、隐私,加上智能体必须读懂的当下情境(你在哪、周围有什么、传感器读到了什么),这些都更适合在离你最近的地方处理。
成本只是一半的故事。端侧能接住这件事,其实是这两年才成立的。放到2023年,端侧模型的能力、NPU的软件栈、加上应用生态都还不成熟,把智能体放到设备上更多是设想。到2026年,小模型、多模态感知、本地推理和跨设备的智能体框架几条线同时往前走,端侧才从一个省钱的备选方案,变成一个真正能改善体验的选项。也是在这个节点,计算发生的位置开始松动并重新排列,而这恰恰是高通的机会。
为什么是高通
这套连续体不是谁都能讲。过去十几年,高通是全球智能手机芯片和基带的核心供应商——你用过的不少安卓旗舰,连接和算力的底层都来自它。只是AI时代的聚光灯大多打在英伟达和云端算力上,高通的名字没那么响。
高通几十年只做一件事:在被电池、体积、散热、连接和实时性死死卡住的设备里,把算力一点点抠出来。这套手艺过去属于移动时代,如今智能体要常驻到这些设备上,它忽然变得稀缺。端侧也跟着换了身份——过去它的卖点是省电和便携,现在它是智能体感知现场、触发行动、就地完成闭环的第一层。
这也是高通最爱讲“每瓦性能”的原因。移动行业几十年其实一直在解同一道题:算力需求涨得比可用能源快。这道题过去出在手机电池上,如今原封不动搬进了数据中心的电力和散热账本——而高通几十年来一直在解这道题。它这条计算带的跨度也大得惊人——一端是功耗两毫瓦的耳机,另一端是2000千瓦的数据中心机柜。
把低功耗计算、连接、庞大的终端出货量和跨品类生态重新组织一遍,这就是高通这次主推的连续体。它想让外界看到的,是自己正从卖一块低功耗芯片,走向提供一整套跨层级的计算系统。
高通这次摆出来的产品,能看出这套打法的轮廓。PC这端,骁龙X2 Elite第一次进了桌面,华硕基于它做了mini PC“Ascent QN10”;更入门的骁龙C平台把带基础AI能力的Arm PC下探到三百美元级,宏碁、惠普、联想都跟了进来。机器人这端,高通发布了Dragonwing(跃龙)IQ10机器人参考设计,把最高700 TOPS的端侧AI算力、18个Qualcomm Oryon CPU核心、多核NPU和GPU、专门的安全岛,连同本地大模型推理和整套开发工具链打包在一起。它交付的不只是一颗芯片,还有一套拿来就能开发、面向量产的系统——这正是机器人这种重续航、重集成的品类最缺的东西。
往物理世界看,逻辑还是同一套。汽车被拆成两层智能——座舱里以人为中心的个性化交互,和靠摄像头、雷达、地图做感知决策的驾驶AI——两层当成一个系统协同,高通把这个趋势叫作走向AI定义的汽车。机器人则按即时反应、动作执行、逻辑推理分层处理算力。再往外,工业和城市场景也在被改写——一颗AI摄像头既能盯安全合规,也能数清路口的车流,看到了还能自己触发下一步。设备千差万别,算力的配比各不相同,底下却是同一条连续的能力带。
高通还想把这条带子延伸到网络本身。它此前在MWC上把6G定义为第一个为AI时代设计的无线技术——除了连接,还多了分布式计算和感知两根支柱。感知这条尤其有想象空间:它让无线网络不只是传输数据,也能成为物理AI获取环境信息的一环,给跑在各处的智能体补上现场情境。
软件生态也已经先动了。主流的开源和闭源模型都能在骁龙平台上跑,OpenClaw、Hermes这类智能体规划器、能本地运行的Claude Desktop,以及高通合作伙伴Humain正在开发的智能体操作系统,都把骁龙当成了落脚点。把端侧当成智能体的家,已经不是高通一家的判断。
高通的“计算连续体”
把镜头拉远,高通这一连串动作,落点其实在它自己身上。
这条连续体的最远端是数据中心,也是高通这次最受关注的一笔。它发布了数据中心新品牌Dragonfly(飞龙),说已经在和超大规模云厂商合作推进部署,但这一次没有公布具体规格和完整路线图——更多信息要等到6月24日的投资者日。外界真正关心的,是它会怎么把Oryon CPU、AI推理和能效优势,组织成一套云厂商愿意接受的数据中心方案。
高通并不是数据中心的新人。2017年它的Centriq试过服务器芯片,没能在当时还不成熟的ARM服务器生态里站住;2021年它花约十四亿美元收购Nuvia重新备料——这支团队的核心成员当年就是打造苹果高性能CPU的人,后来骁龙X系列在PC上的表现,靠的正是他们的底子。端侧是它已经验证过的那一端,数据中心是它还想补上的另一端。
把增长摊开,是这套叙事的现实一面。最新一个财季里,高通芯片业务中的汽车板块创下季度收入纪录,汽车和IoT合计同比增长20%。这让“计算连续体”不只是一个技术故事,也对应着高通正把增长来源从手机往更多设备上摊开的现实。
这场Computex还有另一条主线:云厂商和GPU阵营正从数据中心往边缘走,高通则从端侧往数据中心补——两条路线相向而行,交汇点都落在智能体上。谁走得更顺,要看接下来几年生态怎么长,但双方有一点判断一致:智能体会带来一轮覆盖几乎所有设备的硬件升级,规模可能是这个行业很多年里最大的一次。
所以高通想改写的,与其说是某一类设备,更是它自己在AI产业链里的坐标。它过去卖的是终端里的那块计算能力,现在要让行业相信:智能体时代真正需要的,是一条能从耳机、手机、PC、汽车、机器人一直延伸到数据中心的计算带。
对国内从业者来说,值得盯的也正是这件事。计算的位置一旦开始重新分配,设备怎么设计、芯片怎么排布、云和端的账怎么算,都会跟着重写一遍。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。