Kimi Work对比Codex:功能定位与核心差异解析
摘要
KimiWork是一个面向知识工作者的通用本地智能体,集成了代码、技能、专业数据库、WebBridge
去年Vibe Coding火了一把,但接下来,Vibe Working(氛围办公)大概率会成为更受关注的概念。
就在上周,Kimi正式发布了全新Windows和Mac客户端,最大亮点是引入了Kimi Work模式。
对这款产品,Kimi的定位非常清晰:面向知识工作者的通用型本地Agent。它身上集成了一整套能力:
内核基于Kimi Code,继承了本地Agent、Skill技能包,以及Kimi Agent原有的建站、PPT等能力;接入了同花顺、天眼查等金融、科研、法律领域的专业数据库;内置了可以操控浏览器的WebBridge方案;还带上了从Kimi K2.5开始推出的Agent集群。
把Kimi Work从Coding里独立出来,明确面向知识人群,定位为通用Agent,绝不是因为编程类产品不好。更关键的原因在于,Kimi希望把Agent能力从编程这个垂直场景,泛化到更广阔的领域。
早期编程类Agent产品,呈现方式基本都是“终端”加“命令提示行”,满屏代码对于程序员来说是熟悉的战场,但对非编程背景的用户而言,这实在谈不上友好。所以,Kimi Work选择换一条路。
既然面向知识用户,那就做成用户最熟悉的通用软件形态:右边是对话框,左边侧边栏是功能分类,用户可以在Chatbot模式和新加入的Work模式间自由切换。
从外观上看,Kimi Work和Codex有几分相似,但从内核来看,它远不止是中国版的Codex那么简单。

Kimi Work Beta版软件界面
01、从现在开始氛围办公
去年卡帕西提出的Vibe Coding概念,核心是用自然语言发指令,让Agent通过LLM执行编程任务并交付结果。这个概念当时火得一塌糊涂。
但问题的另一面是:人人都需要做开发、写网页、做小游戏吗?恐怕未必。
从现有数据来看,Mac OS的使用场景中,大约67.2%的日活设备主要从事文档处理、表格制作和办公沟通,覆盖的生产力软件包括Notion、Microsoft 365以及各类办公IM。
Kimi Work恰好是一款针对上述办公场景非常友好的产品。你不再需要面对终端、敲命令、配环境,只需要用自然语言描述目标,Kimi Work就会在你的电脑上自动完成:拆解任务、并行执行子任务、调用本地工具、操作浏览器、创建和整理文件夹、交付文档、表格、PPT等工作成果。
简单来说,除了不能替你使用社交和办公IM与人沟通外,其他大部分办公任务,几乎都可以交给你电脑里的这个通用Agent来执行。
需要特别强调的是:Kimi内置了专业的数据源,包括同花顺、世界银&行经济数据库等。这意味着,金融类用户安装Kimi Work后就能“开箱即用”,完全不需要为相关数据单独付费和配置API。

Kimi Work预装的数据库类型
正是有了这些差异化能力,它才不能被简单理解为“中国版的Codex”。
插上各种插件和数据源的Kimi Work,很有可能带来一场工作范式的变化。过去是Vibe Coding,接下来更多人将进入Vibe Working的状态。
当然,也得多留个心眼:功能虽好,但也有可能无形中生产力被榨干,工作时长变得更长。
02、WebBridge和Agent集群“两只手”
大约在5月中旬,Kimi上线了WebBridge产品,让AI来操作浏览器。当时觉得节奏稍稍有点慢,但没想到不到半个月,这个能力就被直接集成到了Kimi Work之中。这种转变和反差,确实让人印象深刻。
可以说,WebBridge是Kimi Work一只非常关键的手。
过去很多传统的Agent调用网络工具,都是发送HTTP请求,然后获取结构化数据。但问题在于,大量数据和功能需要登录后才能访问,很多平台也设置了非登录用户访问限制,加上验证码等障碍,传统Agent很难轻易越过。
虽然有些平台提供了API,比如X(前Twitter),但价格昂贵、套餐量小,长期使用成本也不低。
Kimi WebBridge的解法是:让Agent真正操作你电脑上的浏览器,像人一样登录、点击、读取页面内容。只要登录状态正常,你可以在对话中直接用自然语言指示它用WebBridge来操作你的浏览器。

指示Kimi Work使用WebBridge取关马斯克X账号
尝试让Kimi Work用WebBridge给马斯克的最新一条推特点赞,然后取关,再重新关注回来。虽然过程中夹杂着推理和对浏览器元素的识别分析,速度不如人类直接操作快,但整个链路能够完整、成功地执行——你完全不需要一直盯着它。
点赞、取关和关注只是WebBridge的简单示例,你可以基于这种能力做更多更有创意的任务延展。比如每天定时去某个页面做一次打卡操作等等。浏览器已经交给了它,剩下的就看任务本身了。

利用Kimi Work生成公众号模板,gif图片由Kimi Work制作
Kimi Work的另一个超酷功能,是集成了在Kimi K2.5时代就出现的Agent集群——简单来说,就是把一项任务拆分成多项子任务,交给不同Agent并行完成。这有点像GPU的并行计算概念,把人类只能串行操作的任务,变成了多Agent并行的范式。
Agent集群最多可以同时调用300个Agent。想象一下:一个人带着300个Agent同时干活,这画面本身就很带感。
过去很多人关心“一人公司(OPC)”究竟是什么。感觉这可能就是一个答案。当然,不是所有任务都会全量调用这么多Agent,实际执行中,主Agent会自动拆解任务,然后合理分配“人力”。

单Agent与Agent集群用时对比
用长鑫招股书PDF(约300页左右)测试了单Agent与Agent集群(包含主Agent共调用5个Agent)的差异。测试中还用到了归藏的PPT Skill。单Agent制作耗时43分钟,而Agent集群只用了21分钟。
当然这里也有推理和最终任务量的差异,时间差别仅供参考,但Agent集群确实把效率直接拉满了。

基于归藏PPT Skill和招股书PDF文件制作的PPT效果,gif图片由Kimi Work制作
03、Skill是真有说法

Kimi Work的“技能”广场
Kimi Work设置了“技能”广场,分为“已安装”和“推荐技能”两个板块。逻辑很好理解:推荐板块是没安装的,已安装里面包括了一些与知识用户场景高度相关的Skill,比如深度研究、竞品分析、战略规划等。这些技能都经过了用户和平台的筛选。
如果广场上的技能满足不了需求,你也可以直接从本地安装自己开发或收集的Skill。
日常使用的话,点开广场直接点击使用即可,但更高频的使用方式应该是在对话框中选择Skill,添加特定Skill后,它会默认提供一段触发提示词。当然,你也可以不勾选,直接用提示词来触发Agent去调用相关Skill。
前面提到的归藏PPT Skill,在昨天下午测试预览版时,线上还没有。当时还特地去找了归藏本人求资源,结果第二天早上发现推荐技能里已经预置了这套Skill。
这个效率,感受一下。

当然,也有可以改进的地方:广场目前还没有计数、分类、搜索这些功能,也没有热度排行。希望后面版本能尽快迭代。
另外,目前已安装的Skill中很多是英文名称和描述,也期待后续能加上更多中文标记。
04、92%的代码由AI生成
文章开头提到过,这是Kimi产品历史上从开发到上线最快的一个产品——整个周期只用了一个星期。
更值得关注的是,这是一款“AI开发的产品”。开发过程中,Kimi工程师使用Kimi Code等Coding Agent工具,一周内完成了Beta版Mac和Windows客户端。开发期间,累计产出超过5万行有效代码,其中92%由AI自主生成。
用一套Agent产品打造了另一款Agent产品——“AI再造AI”这个概念在这里得到了具象化的体现。
而关键支撑是背后的K2.6模型,它对长程任务、Agent集群等能力项提供了强有力的支持——13小时连续编码、300个子Agent并行协作,以及4000余次自主工具调用。

自动化科技线索监控定时任务,gif图片由Kimi Work制作
在此之前试过很多Agent产品,既有原生的,也有各种本土化的产品。自己也曾尝试DIY一些自动化工作流,但功能通常不够稳定,容易中断。不过相信一定会有聪明的公司把这些基础且割裂的能力进行产品化整合。
问题在于:什么样的团队、什么样的公司会来做这件事?
Kimi Work给出的答案是第一方模型公司——模型能力强在哪里,特色是什么,通用Agent产品里就会出现什么样的能力。所以Kimi 2.5和K2.6的长程任务、Agent集群、丰富且经过验证的技能、预装的专业数据库,都一一出现在了Kimi Work里。
最后也想聊一聊安全话题。
在使用Agent产品时,基本不会安装在日常工作的设备上,通常放在云端;即便安装在本地,也会用一台全新设备——因为把工作设备交给Agent总有一个心理障碍需要跨越:它会不会误操作文档、误删数据,会不会泄露隐私?

任务执行权限设置
Kimi Work在这个问题上的解法是:将任务固定在一个指定的文件夹内执行。
这就像一个围栏,Agent所有操作都被限制在这个范围之内。执行过程中,你可以选择让Agent请求权限,也可以直接授权全部权限。
正因为这个设计,Kimi Work算是第一个安装在日常办公设备上的第三方通用Agent产品。
回到文章开头提到的“工作范式”变化:Kimi Work本质上在求解这样一个问题——如果AI Agent不再只是你的“助手”,而是一个可以自主拆解任务、并行工作的“团队”,你的工作方式会变成什么样?
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。