技术资讯

金山办公大模型知识库应用实战解析

2026-05-31

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

金山办公围绕AIHub基座、智能文档库和Copilot构建企业知识大脑，通过RAG架构、多路召回、结

对企业而言，将分散的知识体系化管理至关重要。核心价值在于：实现内部经验的系统化传承，减少重复性劳动，真正激活知识资产的生命力。将大模型AI能力嵌入这一管理框架，相当于为体系注入“认知中枢”，使其从被动的存储仓库进化为能够实时整合、精准剖析、甚至主动输出洞察的智能系统。

本文内容源自金山办公AI知识库技术总监陈亮在QCon 2024北京的深度分享。我们将深入剖析金山办公在AI知识库实战中的核心洞察，包括AI在知识管理领域解决的实际难题、底层技术架构的设计思路、RAG技术落地的关键防错机制，以及我们在调优大模型过程中遇到的典型挑战与应对策略。全文基于现场实录整理，力求还原一线技术决策者的真实思考。

金山办公在知识库业务中的大模型思考和实践

金山的AI发展路径

先聊聊我们的实践背景。坦白讲，目前大模型尚未催生出“全民爆款”级别的应用，金山办公也不例外。去年，我们下定决心全面押注AI，投入大量资源与客户共创，推动产品落地。在4月份的发布会上，我们正式推出AI 365平台，核心产品WPS AI也同步亮相。这套企业级方案的直接目标，就是用AI提升生产力、优化工作流。自去年下半年起，我们与多家企业深度合作，系统梳理客户痛点，逐步将其转化为标准化产品方案。过程中，我们明确了三条主要的技术演进路线。

第一个是AI Hub，可视为智能基座。它要解决的核心命题是“如何让大模型被高效驾驭”。企业对大模型的应用必须有序可控，而非无序堆叠。第二个是AI Docs，即智能文档库。其目标是借助AI赋能文档处理全流程，激活WPS中沉淀的各类文档，使其产生实际业务价值。最后一个是Copilot Pro，本质上是Agent形态的产品。它帮助用户调度各类工具去执行具体任务，让机器自动接管那些低创造性的重复劳动。

AI Hub 智能基座

AI Hub作为基座，首要职责是保障大模型在企业内被安全、可控地调用。打个比方，企业内可能有数百上千人同时使用AI，谁该用哪个模型、消耗了多少token、信息安全如何保障？AI Hub提供了一个统一平台，让企业能够集中管理大模型的接入服务，无论网络环境是公网、私网还是混合部署。接入后，管理层能通过可视化报表一目了然地监控每日token消耗、高频提示词等关键指标。目前，我们已集成国内主流大模型厂商，并支持计费统计，这对企业成本管控非常实用。

AI Docs 智能文档库

AI Docs是我们的智能文档库，它基于WPS多年积累的文档处理能力。金山办公在文档解析方面积淀深厚，无论是文本、表格还是复杂图表，都能实现精准识别与解析。今年行业内对AI知识库的关注度极高，我们的理念是，通过大模型赋能，让企业各环节的文档真正释放价值。过去闲置在硬盘里的文档，如今可通过结构化解析，成为驱动AI的“养料”。

此外，智能文档库还集成了“智能创作”功能。该功能旨在解决“内容生成”难题，在金融、公文、论文等对格式和风格有严格要求的领域，落地价值尤其显著。基于明确的知识来源，我们可以引导大模型产出符合特定要求的内容。比如，我需要撰写一篇QCon大会的演讲稿，只需向知识库投喂几份往期资料，再通过特定机制，大模型就能生成一篇契合大会调性的稿件。这项功能背后的关键技术，我们会在后续章节深入解析。

Copilot

最后是Copilot。它依托API、Agent与大模型的架构，帮助企业调度各类工具完成特定任务。Copilot的目标非常直接：替代日常、重复的简单劳动，降低人力成本。举个内部案例：假设我想创建明天10点的会议，传统流程是打开日历、查找会议室、创建日程、逐一通知参会者。而在Copilot上，只需说一句“明天10点帮我创建个会议并通知相关人员”，它就能解析指令，调用365内部API和组织通讯录API，一步到位。

这里我想提出一个核心概念：未来企业级AI的形态是构建企业专属的知识大脑。这个知识大脑应当像人一样，具备记忆、思考、行动、自我反馈与调节的能力。大模型现在已能调用企业的私有数据、API，以及金山办公的文档处理与365套件能力。再通过AI Hub调用大模型，企业便拥有了强大的思考能力、全面的感知能力、海量的记忆容量和自主规划的执行力。所以，如果用一句话定义WPS AI，那就是：助力企业构建自身的企业大脑，让生产经营活动获得AI加持，实现降本增效。

不同场景下的技术实践

技术层面，我想从三个具体场景展开我们的经验与思考。

首先是智能问答。这是众多AI应用的标配，底层基于RAG检索增强架构。但我今天想重点强调的是“解析、切片与数据安全”这三个预处理环节。许多客户找到我们，表示业务数据丰富、AI提效需求迫切，但卡在RAG的第一步——数据预处理。他们尝试过解析和切片，效果都不尽如人意。因此，我们在这一领域投入了大量精力。

第二个场景是智能创作。创作背后的核心技术涉及召回与SFT（监督微调）。我们会通过SFT对模型进行微调，确保生成内容符合预期，风格更多样化。最后一个是智能简历库。简历场景在企业中非常普遍，但传统大模型在处理统计或检索类问题时（例如“统计一下有多少985硕士”），表现极不稳定。为此，我们采用了结构化提取思路，精准攻克这一痛点。

智能问答

智能问答是AI知识库的核心应用。它的功能是：在海量知识库中，检索出与用户问题最相关的内容，并直接呈现给用户。系统甚至包含“词条”功能，用户配置后，例如输入某个财务同事的名字，系统就能直接跳转至对应聊天框。此外，系统还能检索相关图片并引用文档来源。

这个场景有几个关键点。首先是异构文档的解析，这是RAG架构的“第一道关卡”。文档进入系统后，必须提取其中的核心内容。其次是精准检索，这与传统搜索与推荐技术直接关联。第三是数据安全管控。在企业场景下，问答中的权限管控是巨大挑战。具体来说，用户输入问题后，系统会对query进行改写，并在召回阶段执行权限过滤。

在文档入库阶段，处理流程如下：

解析： 支持海量异构数据源的精准识别。企业内部文档格式五花八门，我们有一套完整机制，能将它们解析成统一规范格式（如Markdown、JSON等）。这是基础能力。
切片： 根据文档的不同布局，采取差异化的切片策略。我们将文档划分为七大类别，包括合同、公文、财报、论文等。每类文档结构迥异，我们依据文档结构（页码、章节、段落、block语义）进行切片，而非“一刀切”。这能显著提升召回率。
召回： 采用多路召回策略。相比单一召回方式，多路召回能获得更高的召回率，这意味着馈送给大模型的上下文更相关，最终答案的质量也更高。
权限： 召回文档后，根据文档的ACL（访问控制列表）进行校验。简单来说，员工只能查看到其有权限访问的文档内容，生成的答案中不会包含无权限信息。这是B端客户最在意的安全痛点。

智能创作

智能创作与智能问答在入口上相似。用户输入一个主题，或匹配到推荐的主题，系统就能自动生成符合特定风格和字数要求的文本。生成的内容可直接填充至云文档模板，支持公文、合同、财报等多种类型，并附上参考文档来源。这个场景有两个核心要求：创作必须基于事实，杜绝捏造；必须支持多种风格，适配不同角色与行业需求。

具体实现路径如下：

主题匹配： 用户输入主题后，系统会召回相关文档片段，自动生成大纲。
大纲生成： 大纲与主题之间通过相似度关联。系统根据大纲进一步匹配知识库中的文件，最终生成文档。
Prompt 调优： 整个过程并非一次完成。系统通过多轮确认（召回-生成-再召回-再生成），让用户逐步调整，直到获得满意内容。
SFT 微调： 为了稳定输出不同风格的内容（如财报严谨、公文正式、合同精准），我们使用开源Lora模型，基于特定数据集进行微调。

目前，智能创作在财报和公文领域的效果已较为理想，但尚未正式向大众开放。因为在实际应用中，许多专业术语与行业“黑话”需要专门处理。例如金融领域的市盈率、P/E，医药行业特有的专业表述，如果不经过专项训练，大模型极易出错。特别是医药行业，对内容准确率近乎“零容忍”。药品说明书一个字都不能差，因为这直接关系到用药安全。因此，这些领域落地前，必须经过严格的多轮验证。

智能简历库

智能简历库是我们的一个特色场景。简历格式相对固定，包含头像、姓名、联系方式、工作经验等结构化信息。但传统大模型在处理统计类问题时（如“有多少硕士”），表现不稳定。所以我们另辟蹊径：结构化提取。

我们结合大模型、NLP和NER（命名实体识别）等算法，将简历中的信息提取出来，以结构化形式存入数据库。当用户提问时（例如“找一个具有AI经验的产品经理”），系统会将问题转化为SQL语句，或通过向量搜索找到相关简历片段。在结构化抽取阶段，我们使用Lora微调，旨在让大模型更精准地识别简历中的关键信息。我们还生成简历摘要，用于后续的JD（职位描述）匹配。

JD匹配与字段匹配是两种不同方式。我们通过语义检索，结合ES（Elasticsearch）技术，能处理“需要多少年工作经验”这类自然语言描述。这样一来，用户可以精确查询“有多少硕士以上学历的同学”，系统不仅能准确回答总数，还能列出具体人员。这在传统大模型的语义问答中极难实现。当然，我们也面临“问题转化为SQL语句”这一技术稳定性的挑战，后续计划通过Lora微调进一步优化。

经验分享

在大模型应用过程中，我感觉这事特别有意思。大模型就像一个知识渊博但偶尔“犯迷糊”的智者，几乎能回答所有问题，但准确性需要我们来兜底。为确保它不出大纰漏，我认为应从四个维度进行约束：设计、数据、优化、踩坑。

设计： 必须具备工程化思维。无论是问答还是创作，都必须有严格的pipeline流程。因为在大模型世界，任何输入的小错误都会被放大，误差会像雪球一样随着流程推进越滚越大。
数据： 经验表明，在数据量不够大时，数据质量远比数量重要。高质量输入是更优选择，因为低质量数据会让大模型输出更加不可控。
优化： 我们内部有一套质量评测平台，用于评估问答或大模型输出质量。核心方法是：给定query和context，让模型输出答案，再结合人工审核与标注，双管齐下，评估回答的好坏。
踩坑： 使用大模型时，最棘手的问题就是输出不稳定。由于它是生成式模型，每次预测结果都可能不同。为应对此问题，我们采用Lora微调、结果缓存或prompt约束等方式，来保证输出的稳定性。

展望未来

在大模型领域，我们经历了第一波以GPT为代表的技术涌现，大家充满好奇与惊叹。紧接着，第二波应用层创新开始到来。尽管目前国内上百个大模型中尚未出现真正的“杀手级应用”，但各行各业（如金融、医药）已经开始积极尝试。

我的判断是，第二波创新应聚焦于各行业的应用场景，进行深度创新。大模型的发展正从“尝鲜”转向“实用主义”，这是必然趋势。第二个观点是开放赋能。面向B端，企业客户需要的是能加速业务、产生价值的实际效果。因此，深入业务、提供实际价值，才是未来的关键。第三，我认为纯粹的理论研究很难直接产生商业价值。混合模式是未来的重要方向。大模型能做很多事，但某些方面可能还不够完美，需要进一步调教。这包括预训练、全参数或部分参数调整等方法。在我们业务中，大小模型的结合，是一个值得持续深挖的方向。

来源：互联网

上一篇 阿里云百炼一站式大模型商业化平台深度评测 下一篇 大模型排行榜：2025年精选对比与推荐

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

金山办公大模型知识库应用实战解析

摘要

相关文章推荐