菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 资讯 > 360 亿方大模型 2.0 重磅发布,全面提升复杂场景下多模态知识处理能力
其他资讯 AI模型 大模型 多模态AI

360 亿方大模型 2.0 重磅发布,全面提升复杂场景下多模态知识处理能力

2026-04-26
阅读 564
热度 564
作者 菜鸟AI编辑部
摘要

摘要

360亿方大模型2 0发布:多模态能力全面进化,直击企业知识管理核心痛点 360亿方智能与360

360亿方大模型2.0发布:多模态能力全面进化,直击企业知识管理核心痛点

360亿方智能与360人工智能研究院联合发布的知识大模型“360亿方大模型”现已升级至2.0版本。此次迭代不仅是版本更新,更代表了模型在处理企业级复杂知识场景时,实现了关键性的能力突破。

新版本核心强化了视觉布局分析、跨模态混合检索与多模态向量化能力,并已集成至360AI知识库产品。其目标明确:解决企业在处理格式多样、信息混杂的非结构化文档时,传统文本知识库效率低下的长期瓶颈。

三大核心技术突破,重塑复杂知识管理范式

360亿方大模型2.0的升级,基于360人工智能研究院自研的RzenEmbed多模态Embedding模型与FG-CLIP图文跨模态模型。本次升级聚焦于“多模态理解、多模态生成、文档智能解析”三大技术方向,旨在突破复杂逻辑与长尾知识处理的极限,其核心创新点有三:

攻克AI视觉“细粒度”难题:传统CLIP模型对图像全局概念把握较好,但在处理细微物体属性、复杂空间关系及精准语言描述时存在局限。360亿方大模型2.0在包含多物体的复杂场景中,细节识别置信度高达96%。这种从宏观感知到微观洞察的能力跃迁,是AI深度理解物理世界的关键进展。

360亿方大模型2.0重磅发布,全面提升复杂场景下多模态知识处理能力

理解画面各元素

打破文本、图像的数据壁垒:模型通过构建统一的语义嵌入空间,实现了跨模态与混合模态的精准语义对齐。用户可使用单一模态(如文本或图片)或组合模态(如“指令+文本+图像”)作为检索条件,高效匹配跨模态相关内容。这直接解决了传统检索中的“模态割裂”与“上下文丢失”问题,实现了文字、图片、图表等多元信息的深度语义融合。

360亿方大模型2.0重磅发布,全面提升复杂场景下多模态知识处理能力

实际问答多模态输出

实现从“基础识别”到“深度研读”的跨越:依托先进的视觉布局分析技术,360亿方大模型2.0实现了对文档形态的像素级感知与人类视角的逻辑还原。它不仅能在倾斜、折叠、满屏水印等极端场景下精准识别内容,更能深度理解文档内部的引注关系、图表关联及上下文脉络。这项能力将碎片化的非结构化数据转化为逻辑严密的结构化知识资产,有效解决了长尾知识识别难、逻辑推导不可信的企业知识管理顽疾。

360亿方大模型2.0重磅发布,全面提升复杂场景下多模态知识处理能力

多栏复杂板式内容识别

综合性能领跑,多项权威评测跻身全球前列

其卓越性能源于对两大自主研发底层模型的深度整合。这两大模型在国际权威基准测试中的领先表现,为360亿方大模型提供了世界级的视觉理解与检索动力。

在视觉语言理解层面,模型集成了专为细粒度图文对齐设计的FG-CLIP2模型。在涵盖长短文本检索、开放世界目标检测等29项公开基准测试中,其表现全面超越了Google的SigLIP 2与Meta的MetaCLIP 2。基于此算法突破,模型实现了从“看清”到“看懂”的质变,不仅能识别图像主体,更能捕捉细微的属性关系与深层语义细节。

360亿方大模型2.0重磅发布,全面提升复杂场景下多模态知识处理能力

其次,在核心的向量化技术上,模型深度集成了RzenEmbed多模态Embedding模型。该模型在国际评测基准MMEB中,凭借综合性能斩获总榜第一与单项第一。在体现企业应用价值的VisDoc(多模态文档检索)专项测试中,更是以绝对优势稳居榜首。这确保了模型在处理复杂办公文档、消除模态割裂方面,具备行业顶级的核心竞争力,正在重新定义企业级RAG检索与知识管理的标准。

360亿方大模型2.0重磅发布,全面提升复杂场景下多模态知识处理能力

四重核心价值,定义企业知识管理高效路径

相较于同类产品,360亿方大模型2.0以“省力、省心、省时、省钱”四大优势,为企业知识管理提供更优解。其价值不仅在于技术能力的整体跨越,更在于对企业业务全流程成本的深度优化。

省力:SaaS化即开即用,零门槛拥抱AI
提供成熟的SaaS化服务,企业无需漫长开发周期。通过直观的交互界面与标准化API,基于360AI知识库产品即可快速部署,让非技术背景的业务人员也能高效运用顶尖AI能力。

省心:高并发企业级特性,无缝适配复杂业务
具备极高的架构稳定性与并发支撑能力,原生支持多模态交互。无论是海量公文流转还是跨部门知识协同,都能在保障数据安全的前提下,提供稳定可靠的技术底座。

省时:从“周”级到“秒”级,极速激活沉睡知识
凭借先进的文档布局分析与向量检索技术,数周人工梳理的非结构化资料,现仅需分钟级即可完成入库;毫秒级响应速度极大缩短了决策链路,让员工快速获取精准答案。

省钱:极致效能比,大幅降低企业综合TCO
通过多模态推理数据合成技术,模型在保持顶尖性能的同时优化了算力消耗。更重要的是,它通过自动化流程替代了繁琐的人工文档结构化工作,激活了企业内部长期“沉睡”的非结构化数据资产,创造了显著的投资回报。

聚焦实战场景,驱动企业知识管理智能化落地

目前,360亿方大模型2.0已深入多项企业知识管理与AI应用场景,依托其视觉布局分析、跨模态混合检索、多模态向量化等能力,精准解决了传统知识库在复杂场景下的应用难题:

复杂版式识别
面对报纸、期刊、多栏研报等图文交织的复杂版面,传统方案常因扫描顺序混乱导致识别错误。即使面对满屏水印、文档弯折、多栏穿插的非理想原始文件,360亿方大模型2.0也能通过视觉布局分析技术,精准梳理出符合人类阅读习惯的内容流,将海量杂乱文档的处理精度提升至可用水平。

360亿方大模型2.0重磅发布,全面提升复杂场景下多模态知识处理能力

专业文档学习
对于数百页的行业标准、技术规范或审计报告,人工查阅易遗漏关键逻辑。360亿方大模型2.0不仅能识别文字,更能理解上下文脉络,自动建立文档内的引注关联。当用户询问具体方案时,系统不仅能给出答案,还能溯源至复杂的逻辑推导过程,赋能员工直接进入高价值决策环节。

360亿方大模型2.0重磅发布,全面提升复杂场景下多模态知识处理能力

以图搜图/搜案
在制造业、电商或设计领域,许多知识难以用文字精确描述。360AI知识库实现了真正的跨模态对齐。用户仅需上传一张零件草图或产品局部照片,系统即可在海量图库中精准锁定相似设计或历史案例,极大提升了知识复用效率。

360亿方大模型2.0重磅发布,全面提升复杂场景下多模态知识处理能力

360亿方大模型2.0的迭代是360对AI底层能力长期投入的成果。从实验室突破到产品上线,它标志着大模型应用从“概念验证”向“生产力工具”的关键转变。通过打破多模态知识处理壁垒,360亿方智能正将难以利用的非结构化数据,转化为驱动企业发展的战略资产,持续推动知识管理向智能化、极简化演进。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多