豆包大模型测评:三个月性能跃升20.3%,落地应用加速
摘要
8月21日,火山引擎AI创新巡展上海站正式开幕。活动期间,豆包大模型系列产品迎来关键迭
8月21日,火山引擎AI创新巡展上海站正式开幕。活动期间,豆包大模型系列产品迎来关键迭代。一个标志性事件是,火山引擎与多点DMALL联合发起成立了零售大模型生态联盟,旨在重塑行业智能化路径。
火山引擎总裁谭待现场披露了豆包大模型的核心进展。最新版豆包大语言模型的综合性能,在三个月内实现了20.3%的显著跃升。来自智源研究院、上海人工智能实验室等第三方机构的基准评测,均证实了其在多项核心指标上的领先优势。
豆包模型进化:使用量爆发,综合能力提升20.3%
市场渗透率数据为模型的竞争力提供了直接证明。QuestMobile报告指出,豆包APP作为豆包大模型的旗舰应用,已在市场中确立显著优势。其上半年月活跃用户数达2752万,规模达到行业第二名产品的2.43倍。
这揭示了一个正向飞轮:海量用户交互持续反哺模型优化,而模型性能的增强又进一步驱动用户增长。谭待透露,截至今年5月,豆包大模型已深度集成于字节跳动内部超50个业务线,日均处理高达1200亿tokens。自对外开放后,企业端采纳量与调用量呈指数级增长。到7月,整体日均处理量已突破5000亿tokens,增长曲线依然陡峭。
能力提升具体体现在哪些维度?综合公开评测集与内部评估,新版豆包大语言模型综合得分提升20.3%。其中,角色扮演与情境对话能力进步最为突出,较发布初期提升38.3%,实现了更拟人、更连贯的多轮交互。在语言理解与信息处理层面,模型在分类抽取、摘要生成、阅读理解与精准问答等任务上的表现提升33.3%,这直接强化了其在企业级服务场景下的实用价值。此外,其在长上下文处理、复杂数学推理、垂直领域知识及代码生成等能力上,也获得了全面增强。

火山引擎总裁谭待介绍豆包大模型业务进展
模型效能的持续突破,源于底层技术与资源的战略性投入。以语音技术为例,豆包团队发表的Seed-ASR与Seed-TTS论文已获学术圈认可,相关成果已转化为豆包模型的语音识别与合成能力。依托于此,火山引擎进一步融合其高并发实时音视频技术,使AI语音交互支持自然打断与插话,端到端延迟控制在1秒内。即使在网络丢包率高达80%的极端环境下,仍能保障通话清晰与流畅度。
成立零售大模型生态联盟,加速企业AI落地
企业如何高效部署大模型?《生成式AI场景落地白皮书》(由Rolling AI、InfoQ与火山引擎联合发布)指出一个明确趋势:超半数受访企业正积极推进大模型应用,其中销售与营销是目前国内企业落地最为集中的场景。
继成功组建汽车与手机生态联盟后,火山引擎此次将生态战略延伸至零售赛道,与多点DMALL共同创立零售大模型生态联盟。

零售大模型生态联盟宣告成立
该联盟的核心使命,是基于豆包大模型构建零售行业专属的AI解决方案,以优化全链路消费体验。其创始成员覆盖零售全业态,包括物美集团、抖音电商、抖音生活服务、百胜中国、麦当劳、中国飞鹤、海底捞、居然之家、7-Eleven、重庆百货、百果园、波司登、天虹股份、三得利、绝味食品、名创优品,以及市场洞察机构尼尔森IQ与电通集团。
为何将零售行业选为下一个生态共建目标?谭待在媒体交流中阐释了其逻辑:“我们的策略是聚焦于AI能带来结构性变革的垂直领域,联合行业关键参与者共同创新。终端设备(如汽车、手机)的AI交互具有天然场景,我们由此切入。零售业同样拥有海量用户触点与高价值数据,变革潜力巨大。与终端行业不同,零售业具备深厚的行业壁垒与专业知识,这恰恰需要深度的、共创式的生态合作。”
事实上,大模型的规模化落地不仅取决于技术成熟度,更依赖于与之匹配的商业生态与组织协同。正是基于这一认知,火山引擎汇聚了商超、餐饮、快消、服饰等各细分领域的头部企业,共同构建零售大模型生态联盟。目标是以AI交互为核心引擎,重构人货场关系,优化从采购、库存到营销、服务的全链条效率,最终为消费者创造更智能、更便捷的购物体验。
多点DMALL创始人、物美集团创始人张文中博士指出,零售大模型生态联盟的本质是行业级的“聚力共创”。通过共享联盟内的技术成果与落地经验,企业能够显著降低试错成本与部署门槛,这是当前零售企业拥抱AI最高效的路径。“全面拥抱AI已不是一道选择题,而是关乎未来生存与发展的必答题。”张文中博士强调。
谭待总结道,大模型技术浪潮正深度重构各行业的智能化基准。火山引擎将持续聚焦于提供“性能更强、成本更优、部署更简”的全栈式AI解决方案,为千行百业的数字化转型注入确定性动力。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。