2024年浏览器AI模型测评:Fara1.5对比OpenAI Operator,谁更胜一筹?
摘要
微软发布专为浏览器设计的Fara1 5系列AI智能体模型,包含4B、9B和27B三个版本。该模型基于Qw
微软研究院AI Frontiers实验室最新发布的Fara1.5系列模型,为浏览器内的AI智能体赛道带来了强劲竞争者。该系列专为浏览器环境下的计算机使用智能体设计,同步推出了4B、9B和27B三个参数规模的版本。

Fara1.5系列需与微软的MagenticLite协同工作。MagenticLite是一个专为智能体设计的沙盒化浏览器界面。其工作原理基于视觉感知:模型直接分析浏览器截图,并输出对应的鼠标点击、键盘输入等操作指令,以此驱动网页任务的逐步完成。
技术架构上,Fara1.5基于Qwen3.5的基础检查点构建,遵循“观察—思考—行动”的决策循环。在每个决策步骤中,模型会整合历史对话记录与最近三张浏览器截图进行推理,随后生成下一个精确的动作指令。
在衡量网页任务执行能力的Online-Mind2Web基准测试中,Fara1.5展现了卓越性能。该基准涵盖136个主流网站及超过300项实际任务,具有高度实践性。其中,参数规模最大的Fara1.5-27B版本实现了72%的任务成功率。
这一成绩在当前同类模型中处于领先地位。作为对比:OpenAI的Operator模型成功率为58.3%,谷歌的Gemini 2.5 Computer Use为57.3%,Yutori Navigator n1为64.7%。值得注意的是,参数更小的Fara1.5-9B版本也达到了63.4%的成功率,显示出优异的效率。
高性能的背后是高质量的训练数据支撑。Fara1.5系列使用了约200万条样本进行微调,数据构成多元:约60%来自真实网页操作轨迹,12.8%源于合成环境,12.5%专注于表单填写与交互模拟,8.8%用于事实锚定训练,另有4.9%来自视觉问答数据。这种混合数据策略旨在全面提升模型对网页语义和用户指令的理解能力。
对于浏览器内自主操作的AI智能体,安全与可控性是核心考量。Fara1.5内置了明确的安全干预机制,在三种情况下会主动暂停并请求用户确认:一是检测到必需的个人信息缺失时;二是任务指令描述模糊不清时;三是即将执行未经用户明确批准的不可逆操作时。所有操作日志均完整保存在MagenticLite中,该沙盒环境本身也构成了智能体与用户真实系统之间的关键安全隔离层。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。