爬虫采集本地RAG流程设计完整流程提示词
这份提示词方案为流程可视化设计师提供了一套从角色定义到执行落地的完整指引,用于生成爬虫采集与本地RAG系统集成的流程示意图,兼顾技术清晰度与视觉表现力。
爬虫采集
本地RAG
流程设计
提示词内容
可直接复制使用
角色定义 你应当以流程可视化设计师与信息架构绘图师的身份,围绕“爬虫采集→数据处理→向量化→本地RAG检索生成”这一完整链路,生成一张结构清晰、标签明确、适合技术文档与演示场景的流程图。目标是一眼能看懂每个环节的输入、处理与输出,同时具备科技感和专业感。 适用场景 技术博客或产品文档中的架构说明图 PPT汇报中系统设计模块的视觉辅助 本地部署类工具的使用手册插图 面试或答辩时的流程展示素材 核心提示词 可直接复制用于图像生成(推荐Midjourney / DALL‑E 3 / Stable Diffusion),也可作为Mermaid流程图描述参考: 英文图像提示词(推荐): A clean, modern flowchart illustrating the end‑to‑end process of web crawler data collection integrated with a local RAG system. Steps from left to right: Web Sources → Scrapy Crawler → Data Cleaning & Deduplication → Text Chunking → Embedding Model (e.g. BGE) → Vector Database (ChromaDB) → Query Input → Retriever → LLM (local, e.g. Llama) → Final Answer. Nodes are rounded rectangles with icons (server, database, brain). Arrows show data flow direction. Color palette: dark blue background (#0B1A2E), neon cyan (#00D4FF), white text, subtle grid lines. Flat illustration style, no photorealism. High contrast, sharp edges. ––v 6.1 中文描述备用: 一张扁平化、科技感的数据流程图,展示从网页爬虫到本地RAG的完整流程。从左至右依次为:网页数据源、爬虫采集(Scrapy)、数据清洗与去重、文本分块、向量化嵌入(BGE)、向量数据库(ChromaDB)、用户查询输入、检索器、本地大模型(Llama)、最终答案。节点用圆角矩形加小图标,箭头清晰,深蓝色背景,霓虹青色高亮,白色文字,无真实感。 Mermaid文本描述(如用于后期手动绘制): graph LR; A[Web Sources] --> B(Scrapy Crawler); B --> C(Data Cleaning/Dedup); C --> D(Text Chunking); D --> E(Embedding Model); E --> F[(Vector DB)]; G(User Query) --> H(Retriever); H --> F; H --> I(Local LLM); I --> J(Final Answer); 风格方向 扁平化信息图,科技蓝为主色调(深蓝底+青蓝高亮) 每个节点附带极简图标(服务器、数据库、大脑、文档) 箭头使用渐变虚线或实线,标注“数据流”“查询流” 背景可选浅灰网格线,增强结构感 字体统一使用无衬线体(如SF Pro、Noto Sans) 构图建议 采用横向从左至右布局,首行展示采集与处理链路,第二行展示RAG内部流程 核心节点放大,辅助节点缩小以突出主逻辑 在“向量数据库”与“检索器”之间增加双向箭头表示索引与搜索 底部可添加一条时间轴标注“离线”与“在线”阶段 整体画面比例推荐16:9,适合投屏和文档嵌入 细节强化 每个节点内部添加简称标签,如“爬虫 (Scrapy)”、“向量库 (ChromaDB)” 数据清洗节点可拆分两个子步骤:去除HTML标签 + 去重,用嵌套框或虚线框 向量化节点旁边用小字标注模型名称(BGE‑small‑zh) 查询路径用橙色箭头区别于数据流的蓝色箭头 最终答案节点添加一个对话气泡图标,强调生成特性 使用建议 图像生成工具:优先使用Midjourney v6.1或DALL‑E 3,提示词可直接复制“英文图像提示词”部分,若不能识别中文则替换为英文 手动绘制工具:可使用Figma / draw.io / Excalidraw导入Mermaid文本再调整样式 文档排版:生成后去背景(纯色背景可后期抠掉),配合深色或浅色页面自适应 多版本输出:可额外生成一版竖构图用于手机端查看,修改布局为自上而下 注意版权:图标素材使用开源或自绘,避免商业协议限制