您的位置 : 资讯 > 其他资讯 > OpenClaw配置QMD降低token消耗

OpenClaw配置QMD降低token消耗

来源：菜鸟下载 | 更新时间：2026-04-01 AI合集 AI文章合集

实践结论实际测试表明，QMD在当前版本对英语文档的语义检索和理解已达到生产级水准，

实践结论

实际测试表明，QMD在当前版本对英语文档的语义检索和理解已达到生产级水准，但在处理中文内容时，其识别的准确性和深度仍有可观的优化潜力。对于中文用户，建议将其作为性能补充方案进行测试，并持续关注官方迭代对多语言模型的改进。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

QMD介绍

QMD（量子记忆数据库）是Shopify联合创始人Tobias Lütke构建的本地化语义搜索与记忆引擎。其架构设计极具巧思——它摒弃了向大语言模型盲目塞入全文的粗放方式，而是通过本地混合检索技术，首先精准锁定文档中最相关的核心片段（通常仅2-3句），再将这个高纯度的上下文“切片”传递给AI进行推理。

这种机制从根源上缓解了传统记忆系统因上下文窗口过载导致的“记忆污染”与“推理噪音”问题。过去，AI助手需要将整个庞大的记忆文件载入上下文，不仅效率低下，更严重消耗了宝贵的Token配额与计算资源。

部署后取得的关键指标提升如下：

✅ Token使用量削减：60-97%（平均降幅超95%）
✅ 响应速度提升：5-50倍
✅ 推理成本降低：90-99%
✅ 答案精准度：93%（作为对比，纯向量搜索精度仅为59%）

QMD的核心优势可概括为：

✅ 完全开源免费
✅ 数据绝对本地化 - 模型、索引及全部数据均在本地运行，确保隐私与安全
✅ 混合检索架构 - 融合BM25关键词匹配、向量语义搜索与LLM重排序三层算法
✅ 零API消耗 - 内置高性能本地模型，彻底摆脱云端配额限制
✅ 原生Agent支持 - 兼容MCP协议，专为自动化AI工作流设计

其技术栈基于TypeScript与Bun运行时，利用node-llama-cpp驱动本地模型。检索层采用三步流水线：首先进行BM25全文快速筛选，接着通过向量嵌入进行语义对齐，最后交由轻量级LLM对候选结果进行智能重排序。所有模型均以GGUF格式在本地离线运行。

核心资源链接：

QMD GitHub: https://github.com/tobi/qmd
OpenClaw官网: https://openclaw.ai

前置条件

自OpenClaw 2026.2.2版本起，该系统已原生集成QMD作为可选的记忆后端。这套由顶尖工程师打造的语义搜索引擎，为AI智能体的长期记忆与知识召回效率带来了革新。

首先，请通过终端命令确认你当前的OpenClaw版本：

openclaw -v

若版本号低于2026.2.2，你需要先将其更新至最新稳定版，以解锁QMD的全部功能。

安装QMD

1、安装QMD

主流方式是使用npm进行全局安装：

# 使用npm安装 npm install -g @tobilu/qmd

若你追求极致的安装与运行速度，可选择Bun作为替代运行时：

# 安装bun curl -fsSL https://bun.sh/install | bash # bun安装qmd bun install -g github:tobi/qmd

安装完成后，务必执行版本验证命令：

终端应输出类似qmd 2.0.1 (bab86d5)的版本信息。

# 查看QMD版本 qmd -v

2、安装SQLite

QMD依赖于支持向量扩展的SQLite数据库环境：

# 更新包列表 sudo apt update # 安装sqlite3 sudo apt install sqlite3 libsqlite3-dev # 验证安装 sqlite3 --version

3、配置QMD

接下来，需要修改OpenClaw的主配置文件~/.openclaw/openclaw.json。操作前，建议进行备份：

cp ~/.openclaw/openclaw.json ~/.openclaw/openclaw.json.bak

编辑配置文件，添加或修改memory配置段：

{"memory": {"backend": "qmd","qmd": {"limits": {"timeoutMs": 8000}}}}

配置参数解析：

backend: "qmd" - 将记忆后端切换至QMD引擎。

timeoutMs: 8000 - 将检索超时时间设置为8秒（默认4秒在某些复杂查询下可能不足）。

4、重启openclaw

重启服务后，OpenClaw将自动启用QMD处理所有记忆检索请求。系统具备优雅的降级机制：若QMD运行异常，将无缝回退至内置的SQLite记忆系统，保障服务连续性。

# 重启OpenClaw Gateway服务 openclaw gateway restart

5、验证QMD是否正常

方法1：查看OpenClaw日志

通过日志确认QMD后端已成功加载并初始化：

# 查看OpenClaw日志 openclaw logs --follow # 查看OpenClaw与qmd相关的日志 openclaw logs | grep qmd

寻找包含qmd memory的关键日志行，例如：info gateway {"subsystem":"gateway"} qmd memory startup initialization armed for agent "main"。

方法2：检查QMD状态

# 查看QMD状态 qmd status

正常输出示例如下图所示：

你可能会看到一些提示信息，这通常是运行状态日志，而非错误报告。

QMD在初次启动时会执行以下自适应流程：

尝试GPU加速 - 自动编译支持Vulkan后端的llama.cpp。

编译失败 - 大多数系统默认未安装Vulkan图形驱动。

自动回退 - 无缝切换到纯CPU计算模式（falling back to no GPU）。

这是预期内的标准行为，QMD在CPU模式下仍可全功能工作。

如需启用GPU加速以提升检索速度，请手动安装Vulkan驱动：

# Ubuntu/Debian sudo apt install vulkan-tools libvulkan-dev # 安装后重启qmd服务，引擎将自动重新编译以启用GPU支持

方法3：实际测试

最直接的验证方法是与OpenClaw进行对话，询问关于历史会话的具体细节，亲身感知其响应速度与答案准确度的提升。

卸载QMD

1、修改配置

编辑配置文件~/.openclaw/openclaw.json，将记忆后端改回sqlite：

{"memory": {"backend": "sqlite"// 恢复为默认的SQLite后端}}

你也可以选择直接删除整个memory配置块，系统将自动使用SQLite作为默认后端。

2、重启openclaw

# 重启Gateway openclaw gateway restart # 等待3秒后检查状态 sleep 3 && openclaw gateway status

3、卸载QMD包

# npm方式卸载 npm uninstall -g @tobilu/qmd # 或bun方式卸载 bun uninstall -g @tobilu/qmd

4、清理qmd数据（可选但建议）

删除QMD生成的索引与缓存文件，彻底释放磁盘空间：

# 查看qmd数据占用 du -sh ~/.openclaw/agents/main/qmd/ # 删除qmd数据目录 rm -rf ~/.openclaw/agents/main/qmd/ # 验证删除 ls -la ~/.openclaw/agents/main/ | grep qmd # 应无输出（目录已不存在）