其他资讯 RAG完整工作流程

Dify RAG完整工作流程：检索增强生成原理详解

2026-06-07

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

Dify的RAG机制本质上是一套“先检索再生成”的流程。它并非简单存入文档，而是通过文档

Dify的RAG机制本质上是一套“先检索再生成”的流程。它并非简单存入文档，而是通过文档预处理（语义切块）、向量化索引（嵌入模型+向量库）、三步检索（查询向量→ANN搜索→重排序），并在生成阶段加入引用溯源与禁止虚构约束，才能实现精准问答。这四个环节任何一处出现偏差，模型都可能输出错误答案。

先挑明一点：要让大模型准确回答、不胡编、还能直接使用你上传的最新PDF或内部文档，仅靠“拖拽上传”远不够。你必须理解RAG在Dify中如何一步步将知识“喂”给模型。这不仅是存储文件，而是从切片、向量化、检索匹配到生成，环环相扣。

文档预处理：切块不是机械分段

第一步，将原始文档（PDF/Word/TXT）拆分为语义连贯的小片段。Dify默认按512 token切分，但关键在于不能切断句子或表格结构。举例来说，一段景区开放时间说明：“周一至周五 8:00–17:00，周六日及节假日 8:00–18:00”。若程序在“周五”后硬切一刀，后半句“周六日……”就成了孤立片段。用户查询“节假日开放时间”时，检索系统只命中该孤立片段，前半句“周一至周五”被遗漏，完整信息无法召回。

手动上传前，建议先用文本编辑器检查文档中是否存在乱码、页眉页脚，或扫描PDF遗留的OCR错字——这些噪声会直接污染向量表示，导致检索精准度下降。

操作本身很简单：将文件直接拖入Dify知识库的上传区域，系统会自动触发解析流程。

向量化与索引构建：让文字变成可搜索的“坐标”

文档切块后，要让机器理解这些文字块的含义，需要将其转换成向量——可理解为给每个片段赋予一个高维空间中的坐标。

方法一：使用Dify内置嵌入模型自动处理
上传完成后，Dify会调用默认的嵌入模型（如bge-m3），将每个文本块转为高维向量，并存入内置向量数据库（Chroma）。整个过程无需额外配置，等待状态栏显示“已就绪”即可进入下一步。

方法二：自定义嵌入模型（适合高级用户）
在【知识库】→【设置】→【嵌入模型】中，可切换为本地部署的BGE或OpenAI text-embedding-3-small。注意：更换模型后必须重新处理全部文档，否则新旧向量混存会导致检索彻底失效。

向量数据库不支持SQL式精确匹配，它只识别“相似度”。余弦值越接近1.0，语义越相近。例如用户问“退票怎么扣钱”，即便文档中写的是“门票退款手续费”，向量空间距离也能将相关片段捞取出来。

检索阶段：三步锁定最相关片段

检索并非一次性完成，而是分三步进行：

第一步：用户输入问题后，Dify实时调用相同嵌入模型，将问题转为查询向量。
第二步：在向量库中执行近邻搜索（ANN），默认返回top-3最相似文本块。
第三步：对结果执行重排序（Rerank），使用交叉编码器二次打分，将真正语义匹配的片段前置。这一步骤能显著压低关键词巧合匹配的误召回——例如用户搜索“苹果手机”，不会因为文档中出现“苹果园介绍”而被错误召回。

检索结果不会直接原始输出，而是作为上下文拼接到系统提示词末尾，格式如下：

【参考上下文】{文本块1} {文本块2}…

生成阶段：模型只许“照着念”，不许“自己编”

最后阶段，系统将原始问题、参考信息块以及预设Prompt（包含角色、格式、禁令）一并提交给大语言模型。Dify默认开启“引用溯源”开关，生成的答案中每个事实性陈述都会标注来源块编号，便于回溯验证。

更关键的是：若检索阶段未命中任何片段，且Prompt中设置了“未检索到则回复‘请咨询人工客服’”，模型绝不会强行编造。这一闸门是抑制幻觉最有效的防线。

这一步不能跳过：必须在应用编排中开启【启用RAG】并绑定对应知识库，否则所有输入都会走纯LLM路径，完全不会触及你上传的文档。记住，RAG并非自动生效，需要你手动打开开关。

来源：互联网

上一篇 可灵AI广告宣传片制作教程：2025最新版高效指南 下一篇 2025 Dify知识库创建与文档批量导入实操全流程详解

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

Dify RAG完整工作流程：检索增强生成原理详解

摘要

文档预处理：切块不是机械分段

向量化与索引构建：让文字变成可搜索的“坐标”

检索阶段：三步锁定最相关片段

生成阶段：模型只许“照着念”，不许“自己编”

相关文章推荐