腾讯Marvis内测体验:6大AI助手如何提升工作效率?
摘要
腾讯推出AI助手“马维斯”,定位为操作系统层级的智能体。它能深度管理文件、操作系统

马维斯的官方形象。图片为AI生成效果。
5月12日,腾讯应用宝团队正式对外发布了其AI助手产品“Marvis”,并公布了其中文名称“马维斯”。
“名字的灵感部分来源于‘贾维斯’,”产品负责人王秋阳介绍道,“既然现实中不存在‘牛马’这种生物,我们就自己设计了一个。我们移除了马的鬃毛,添加了小牛角,再配上腾讯标志性的红围脖,最终呈现出这个可爱的形象。”
在功能定位上,马维斯是一个能够智能解析归类文档、处理图像、甚至执行系统级维护任务的智能体(Agent)。市面上主流AI助手的能力,如理解系统架构、调度模型、操控桌面及移动端应用等,它均已覆盖。其核心差异点在于对操作系统底层与文件系统的深度访问与控制权限,以及根据任务复杂度智能调度不同模型的机制。

马维斯核心功能概览
整个沟通会中,“操作系统层级的AI助手”这一关键词被反复提及,精准概括了马维斯的战略目标。
“我们的目标是打造一个深度集成于操作系统、高度个性化的AI助手,而非一个功能孤立的AI工具,比如仅限于制作PPT或类似‘龙虾’那样的产品。”马维斯业务负责人蔡建涛如此定义其产品边界。
观看产品演示,最直观的感受是它像一个能帮你“诊断并修复电脑”的智能体。更确切地说,马维斯可以被视为一个拥有“资源管理器”最高权限的AI助手——用户能够直接通过它管理文件、解读文档、修改系统设置、执行复杂工作流,甚至操控Android应用。
一个恰当的类比是:许多NAS设备已具备基础的AI引擎来管理存储的文件与图片。马维斯与之类似,但它直接部署在你的个人电脑上,开箱即用,无需用户费力寻找和配置各类功能插件。
马维斯能做的事情
一个对话框,一个工具面板,一段会话记录——仅从界面框架看,马维斯与其他AI助手似乎区别不大。
“许多AI产品的交互界面都类似一个对话框,无论是聊天机器人还是编程工具,”蔡建涛承认,“但我们的长期愿景是让用户通过最自然的语音对话,就能在设备上完成绝大多数操作。”
现阶段,马维斯的核心定位是一个Agent化的“资源管理器”:通过深度接入操作系统权限,来管理文档、图片、生成内容并执行任务。其文档支持范围涵盖课件、简历、合同、票据等多种格式;图库管理则能依据图像元数据、视觉内容乃至OCR识别出的文字进行智能分类。
客观来说,这些能力并非独家。马维斯的关键不同在于其智能路由机制:它能自动将不同规模的任务分发给不同的模型处理,其中部分模型部署在本地,这确保了在断网环境下仍能使用核心功能。
这直接回应了用户对“Token消耗成本”的普遍关切。马维斯试图从产品架构层面优化这一问题,当然,这也对本地硬件的算力提出了更高要求,因为它预装了多个本地模型。
那么,马维斯为何选择这条“重本地”的技术路径?根源在于其“系统级”的定位。应用宝团队与操作系统及硬件厂商保持着长期的深度合作,这使得即使是较小的端侧模型也能获得快速适配,并取得访问系统底层所必需的授权。
因此,马维斯像一个能“修电脑”的Agent,但其独特优势在于,凭借Windows系统及硬件的开放权限,它能直接读取软硬件的实时信息。

马维斯检测电脑硬件配置演示
产品负责人王秋阳演示了一个典型场景:用户想运行某款大型游戏,但不清楚电脑配置是否达标。马维斯可以自动感知当前硬件配置,联网查询该游戏的官方推荐配置,并进行比对分析,最终向用户给出明确结论。
另一个虽不频繁但极具实用性的演示是:关闭Windows系统的广告推送。如果询问普通聊天机器人,它通常只能提供文字操作步骤;其他Agent或许也能完成,但过程可能涉及多次授权确认。而马维斯在接收指令后,是直接执行关闭广告的任务操作。

通过马维斯一键关闭Windows系统广告
针对高隐私敏感用户,马维斯提供了“隐私模式”,可将任务完全限定在端侧模型运行,数据不出设备。“在一些组织机构内部,特别是财务或HR部门,处理敏感数据时往往要求物理断网,”王秋阳解释了此功能的设计初衷。
此外,在桌面端直接操作手机应用是马维斯的另一亮点,这得益于应用宝团队的既有技术积累。这意味着许多日常操作无需切换至手机,例如应用签到打卡。未来,对于一些应用内的打卡领奖活动,马维斯或许也能代为完成。至于点外卖、操作小程序等场景,则更在其能力范围之内。
据产品团队介绍,马维斯在桌面端操作移动应用时,不会抢占用户的键盘鼠标控制权,并支持多开。只要硬件性能足够且应用接口开放,这类桌面级Agent确实有望帮助PC生态,从移动设备那里重新夺回一部分用户使用时长。
它有什么不一样?
尽管基础界面相似,但马维斯在产品呈现上增添了一份新意——一个卡通风格的Agent工作室。根据Agent的角色与实时工作状态,界面会呈现不同的动态视觉效果。

马维斯与它的Agent工作伙伴
在演示中,官方展示了一个“团队协作”场景:预设的6个Agent组成了一个工作小组,包括佩戴红围脖的主Agent、戴绿围脖的电脑操作Agent等,甚至还有处于“休闲”状态的Agent。
“它暂时没有紧急任务,可能会去‘喝咖啡’、‘跑步’或者交流些操作技巧。”介绍到这里时,现场气氛轻松。能引发听众会心一笑,恰恰证明这是一个能有效吸引用户注意力的产品设计。
“我们清楚,在执行耗时较长的任务时,用户需要明确的进度反馈。卡通办公室和角色状态的设计,正是为了向用户清晰地呈现这些状态信息。”团队如此解释其设计思考。
当然,视觉差异并非核心。真正的竞争力,始终围绕“操作系统层级AI助手”这一根本理念构建。
“我们天生就是一个与硬件和生态紧密协作的团队。马维斯并非凭空构想的产物,而是在我们既有技术基因和生态位之上自然‘生长’出来的。”产品团队强调。
据了解,马维斯背后的应用宝团队,与微软、英特尔、高通等产业伙伴深度合作,专门优化端侧模型的推理效率。这带来一个显著优势:用户处理文档时,无需经历繁琐的“上传”步骤。因为对于整个操作系统而言,马维斯本身就是一个资源管理器,整个文件系统就是它可直接访问、即时处理的资料库。
这也正是马维斯被视为一个“内嵌”了资源管理器的Agent,并有望承接部分移动端使用场景的原因。
按照产品规划,马维斯的能力建设遵循自底向上的路径:先从文件操作(解析、转换、搜索、索引)开始,再到应用管理(模块化应用商店能力,支持查询、安装、启动),进而实现系统操作(直接修改设置、诊断修复),最终搭建起完整的Agent框架。
“整个系统沿着既定技术路线推进,到了2025年12月,框架已基本稳固,我们不会再去切换其他技术路径。”王秋阳总结道。
一个选Marvis的理由
市场上前有成熟产品,后有新晋选手,用户为何还要选择马维斯这个“新面孔”?
沟通会上被问及此问题时,马维斯团队坦言,他们并没有一句“杀手锏”式的口号来说服用户。从界面和基础功能看,同类产品确实存在同质化,常规能力大家都有。
对于终端用户而言,无需也无感于底层技术路线的差异。各类Agent产品最终比拼的,是在相同功能下,谁的操作更精准、结果交付更迅捷,以及当前最受关注的:谁更能有效控制使用成本(Token消耗)。
在马维斯产品团队看来,与其打磨单一的“杀手级功能”,他们更倾向于通过提供长链条的场景化解决方案来吸引用户。
“例如,电脑上有一个‘证件照’文件夹,用户点进去的意图是什么?可能是办理签证、申请驾照,或者需要裁剪图片、更换背景色。我们就把这一系列相关联的能力都集中在这个入口。用户点进来时,其需求大概率就在这个场景内,这就是将能力场景化地嵌入用户原有的操作习惯。”
关于马维斯的生产力属性,现场关注度很高。文档处理本身即是生产力工具,但业界更想了解其在编程等高阶场景的表现。
“我们在办公分支投入了大量资源,包括文档格式转换、编辑总结等。但在代码生成方面,我们目前的投入相对有限,”蔡建涛在现场表示,“我们的文档处理能力绝对优于市面上绝大多数产品,但我们不会追求覆盖办公全场景,因为那过于庞大复杂。”
端侧隐私模式也是焦点之一。开启后,模型完全在离线环境下运行。这与效率模式有何区别?直观来看,模型尺寸与能力必然存在权衡,端侧模型无法与云端大模型的全能性直接媲美。但关键在于,产品需要清晰告知用户,在离线场景下,端侧模型具体能胜任哪些任务,哪些功能项是可用的,以便用户做出合理预期与选择。
除了明确的能力边界,端侧模型的“零Token消耗”无疑是其核心优势,直接转化为用户使用成本的降低。
写在最后
传统软件产品往往追求完美再发布。但AI时代的开发节奏截然不同,边迭代边优化已成为常态。
按照马维斯团队的说法,他们在2025年12月基本完成产品上下层框架搭建后,判断产品“已达到面向用户开放的条件”,于是选择在2026年5月正式推出。
因此,目前用户看到的马维斯仍是一个初步形态,未来将持续迭代并增加新能力。但所有新增功能都将紧密围绕“操作系统层级的AI助手”这一定位展开。正如前文所概括的:它是一个拥有资源管理器权限的AI Agent——不仅能对话,更能操作;不仅能回答,更能执行;不仅存在于云端,更深度集成于你的本地设备。

来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。