菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > 金山办公大模型知识库应用实战解析
技术资讯

金山办公大模型知识库应用实战解析

2026-05-31
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

金山办公围绕AIHub基座、智能文档库和Copilot构建企业知识大脑,通过RAG架构、多路召回、结

对企业而言,将分散的知识体系化管理至关重要。核心价值在于:实现内部经验的系统化传承,减少重复性劳动,真正激活知识资产的生命力。将大模型AI能力嵌入这一管理框架,相当于为体系注入“认知中枢”,使其从被动的存储仓库进化为能够实时整合、精准剖析、甚至主动输出洞察的智能系统。

本文内容源自金山办公AI知识库技术总监陈亮在QCon 2024北京的深度分享。我们将深入剖析金山办公在AI知识库实战中的核心洞察,包括AI在知识管理领域解决的实际难题、底层技术架构的设计思路、RAG技术落地的关键防错机制,以及我们在调优大模型过程中遇到的典型挑战与应对策略。全文基于现场实录整理,力求还原一线技术决策者的真实思考。

金山办公在知识库业务中的大模型思考和实践

金山的AI发展路径

先聊聊我们的实践背景。坦白讲,目前大模型尚未催生出“全民爆款”级别的应用,金山办公也不例外。去年,我们下定决心全面押注AI,投入大量资源与客户共创,推动产品落地。在4月份的发布会上,我们正式推出AI 365平台,核心产品WPS AI也同步亮相。这套企业级方案的直接目标,就是用AI提升生产力、优化工作流。自去年下半年起,我们与多家企业深度合作,系统梳理客户痛点,逐步将其转化为标准化产品方案。过程中,我们明确了三条主要的技术演进路线。

第一个是AI Hub,可视为智能基座。它要解决的核心命题是“如何让大模型被高效驾驭”。企业对大模型的应用必须有序可控,而非无序堆叠。第二个是AI Docs,即智能文档库。其目标是借助AI赋能文档处理全流程,激活WPS中沉淀的各类文档,使其产生实际业务价值。最后一个是Copilot Pro,本质上是Agent形态的产品。它帮助用户调度各类工具去执行具体任务,让机器自动接管那些低创造性的重复劳动。

AI Hub 智能基座

AI Hub作为基座,首要职责是保障大模型在企业内被安全、可控地调用。打个比方,企业内可能有数百上千人同时使用AI,谁该用哪个模型、消耗了多少token、信息安全如何保障?AI Hub提供了一个统一平台,让企业能够集中管理大模型的接入服务,无论网络环境是公网、私网还是混合部署。接入后,管理层能通过可视化报表一目了然地监控每日token消耗、高频提示词等关键指标。目前,我们已集成国内主流大模型厂商,并支持计费统计,这对企业成本管控非常实用。

AI Docs 智能文档库

AI Docs是我们的智能文档库,它基于WPS多年积累的文档处理能力。金山办公在文档解析方面积淀深厚,无论是文本、表格还是复杂图表,都能实现精准识别与解析。今年行业内对AI知识库的关注度极高,我们的理念是,通过大模型赋能,让企业各环节的文档真正释放价值。过去闲置在硬盘里的文档,如今可通过结构化解析,成为驱动AI的“养料”。

此外,智能文档库还集成了“智能创作”功能。该功能旨在解决“内容生成”难题,在金融、公文、论文等对格式和风格有严格要求的领域,落地价值尤其显著。基于明确的知识来源,我们可以引导大模型产出符合特定要求的内容。比如,我需要撰写一篇QCon大会的演讲稿,只需向知识库投喂几份往期资料,再通过特定机制,大模型就能生成一篇契合大会调性的稿件。这项功能背后的关键技术,我们会在后续章节深入解析。

Copilot

最后是Copilot。它依托API、Agent与大模型的架构,帮助企业调度各类工具完成特定任务。Copilot的目标非常直接:替代日常、重复的简单劳动,降低人力成本。举个内部案例:假设我想创建明天10点的会议,传统流程是打开日历、查找会议室、创建日程、逐一通知参会者。而在Copilot上,只需说一句“明天10点帮我创建个会议并通知相关人员”,它就能解析指令,调用365内部API和组织通讯录API,一步到位。

这里我想提出一个核心概念:未来企业级AI的形态是构建企业专属的知识大脑。这个知识大脑应当像人一样,具备记忆、思考、行动、自我反馈与调节的能力。大模型现在已能调用企业的私有数据、API,以及金山办公的文档处理与365套件能力。再通过AI Hub调用大模型,企业便拥有了强大的思考能力、全面的感知能力、海量的记忆容量和自主规划的执行力。所以,如果用一句话定义WPS AI,那就是:助力企业构建自身的企业大脑,让生产经营活动获得AI加持,实现降本增效。

不同场景下的技术实践

技术层面,我想从三个具体场景展开我们的经验与思考。

首先是智能问答。这是众多AI应用的标配,底层基于RAG检索增强架构。但我今天想重点强调的是“解析、切片与数据安全”这三个预处理环节。许多客户找到我们,表示业务数据丰富、AI提效需求迫切,但卡在RAG的第一步——数据预处理。他们尝试过解析和切片,效果都不尽如人意。因此,我们在这一领域投入了大量精力。

第二个场景是智能创作。创作背后的核心技术涉及召回与SFT(监督微调)。我们会通过SFT对模型进行微调,确保生成内容符合预期,风格更多样化。最后一个是智能简历库。简历场景在企业中非常普遍,但传统大模型在处理统计或检索类问题时(例如“统计一下有多少985硕士”),表现极不稳定。为此,我们采用了结构化提取思路,精准攻克这一痛点。

智能问答

智能问答是AI知识库的核心应用。它的功能是:在海量知识库中,检索出与用户问题最相关的内容,并直接呈现给用户。系统甚至包含“词条”功能,用户配置后,例如输入某个财务同事的名字,系统就能直接跳转至对应聊天框。此外,系统还能检索相关图片并引用文档来源。

这个场景有几个关键点。首先是异构文档的解析,这是RAG架构的“第一道关卡”。文档进入系统后,必须提取其中的核心内容。其次是精准检索,这与传统搜索与推荐技术直接关联。第三是数据安全管控。在企业场景下,问答中的权限管控是巨大挑战。具体来说,用户输入问题后,系统会对query进行改写,并在召回阶段执行权限过滤。

在文档入库阶段,处理流程如下:

  • 解析: 支持海量异构数据源的精准识别。企业内部文档格式五花八门,我们有一套完整机制,能将它们解析成统一规范格式(如Markdown、JSON等)。这是基础能力。

  • 切片: 根据文档的不同布局,采取差异化的切片策略。我们将文档划分为七大类别,包括合同、公文、财报、论文等。每类文档结构迥异,我们依据文档结构(页码、章节、段落、block语义)进行切片,而非“一刀切”。这能显著提升召回率。

  • 召回: 采用多路召回策略。相比单一召回方式,多路召回能获得更高的召回率,这意味着馈送给大模型的上下文更相关,最终答案的质量也更高。

  • 权限: 召回文档后,根据文档的ACL(访问控制列表)进行校验。简单来说,员工只能查看到其有权限访问的文档内容,生成的答案中不会包含无权限信息。这是B端客户最在意的安全痛点。

智能创作

智能创作与智能问答在入口上相似。用户输入一个主题,或匹配到推荐的主题,系统就能自动生成符合特定风格和字数要求的文本。生成的内容可直接填充至云文档模板,支持公文、合同、财报等多种类型,并附上参考文档来源。这个场景有两个核心要求:创作必须基于事实,杜绝捏造;必须支持多种风格,适配不同角色与行业需求。

具体实现路径如下:

  • 主题匹配: 用户输入主题后,系统会召回相关文档片段,自动生成大纲。

  • 大纲生成: 大纲与主题之间通过相似度关联。系统根据大纲进一步匹配知识库中的文件,最终生成文档。

  • Prompt 调优: 整个过程并非一次完成。系统通过多轮确认(召回-生成-再召回-再生成),让用户逐步调整,直到获得满意内容。

  • SFT 微调: 为了稳定输出不同风格的内容(如财报严谨、公文正式、合同精准),我们使用开源Lora模型,基于特定数据集进行微调。

目前,智能创作在财报和公文领域的效果已较为理想,但尚未正式向大众开放。因为在实际应用中,许多专业术语与行业“黑话”需要专门处理。例如金融领域的市盈率、P/E,医药行业特有的专业表述,如果不经过专项训练,大模型极易出错。特别是医药行业,对内容准确率近乎“零容忍”。药品说明书一个字都不能差,因为这直接关系到用药安全。因此,这些领域落地前,必须经过严格的多轮验证。

智能简历库

智能简历库是我们的一个特色场景。简历格式相对固定,包含头像、姓名、联系方式、工作经验等结构化信息。但传统大模型在处理统计类问题时(如“有多少硕士”),表现不稳定。所以我们另辟蹊径:结构化提取

我们结合大模型、NLP和NER(命名实体识别)等算法,将简历中的信息提取出来,以结构化形式存入数据库。当用户提问时(例如“找一个具有AI经验的产品经理”),系统会将问题转化为SQL语句,或通过向量搜索找到相关简历片段。在结构化抽取阶段,我们使用Lora微调,旨在让大模型更精准地识别简历中的关键信息。我们还生成简历摘要,用于后续的JD(职位描述)匹配。

JD匹配与字段匹配是两种不同方式。我们通过语义检索,结合ES(Elasticsearch)技术,能处理“需要多少年工作经验”这类自然语言描述。这样一来,用户可以精确查询“有多少硕士以上学历的同学”,系统不仅能准确回答总数,还能列出具体人员。这在传统大模型的语义问答中极难实现。当然,我们也面临“问题转化为SQL语句”这一技术稳定性的挑战,后续计划通过Lora微调进一步优化。

经验分享

在大模型应用过程中,我感觉这事特别有意思。大模型就像一个知识渊博但偶尔“犯迷糊”的智者,几乎能回答所有问题,但准确性需要我们来兜底。为确保它不出大纰漏,我认为应从四个维度进行约束:设计、数据、优化、踩坑

  1. 设计: 必须具备工程化思维。无论是问答还是创作,都必须有严格的pipeline流程。因为在大模型世界,任何输入的小错误都会被放大,误差会像雪球一样随着流程推进越滚越大。

  2. 数据: 经验表明,在数据量不够大时,数据质量远比数量重要。高质量输入是更优选择,因为低质量数据会让大模型输出更加不可控。

  3. 优化: 我们内部有一套质量评测平台,用于评估问答或大模型输出质量。核心方法是:给定query和context,让模型输出答案,再结合人工审核与标注,双管齐下,评估回答的好坏。

  4. 踩坑: 使用大模型时,最棘手的问题就是输出不稳定。由于它是生成式模型,每次预测结果都可能不同。为应对此问题,我们采用Lora微调、结果缓存或prompt约束等方式,来保证输出的稳定性。

展望未来

在大模型领域,我们经历了第一波以GPT为代表的技术涌现,大家充满好奇与惊叹。紧接着,第二波应用层创新开始到来。尽管目前国内上百个大模型中尚未出现真正的“杀手级应用”,但各行各业(如金融、医药)已经开始积极尝试。

我的判断是,第二波创新应聚焦于各行业的应用场景,进行深度创新。大模型的发展正从“尝鲜”转向“实用主义”,这是必然趋势。第二个观点是开放赋能。面向B端,企业客户需要的是能加速业务、产生价值的实际效果。因此,深入业务、提供实际价值,才是未来的关键。第三,我认为纯粹的理论研究很难直接产生商业价值。混合模式是未来的重要方向。大模型能做很多事,但某些方面可能还不够完美,需要进一步调教。这包括预训练、全参数或部分参数调整等方法。在我们业务中,大小模型的结合,是一个值得持续深挖的方向。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多