您的位置 : 资讯 > 其他资讯 > OpenClaw配置QMD降低token消耗

OpenClaw配置QMD降低token消耗

来源:菜鸟下载 | 更新时间:2026-04-01 AI合集 AI文章合集

实践结论 实际测试表明,QMD在当前版本对英语文档的语义检索和理解已达到生产级水准,

实践结论

实际测试表明,QMD在当前版本对英语文档的语义检索和理解已达到生产级水准,但在处理中文内容时,其识别的准确性和深度仍有可观的优化潜力。对于中文用户,建议将其作为性能补充方案进行测试,并持续关注官方迭代对多语言模型的改进。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

QMD介绍

QMD(量子记忆数据库)是Shopify联合创始人Tobias Lütke构建的本地化语义搜索与记忆引擎。其架构设计极具巧思——它摒弃了向大语言模型盲目塞入全文的粗放方式,而是通过本地混合检索技术,首先精准锁定文档中最相关的核心片段(通常仅2-3句),再将这个高纯度的上下文“切片”传递给AI进行推理。

这种机制从根源上缓解了传统记忆系统因上下文窗口过载导致的“记忆污染”与“推理噪音”问题。过去,AI助手需要将整个庞大的记忆文件载入上下文,不仅效率低下,更严重消耗了宝贵的Token配额与计算资源。

部署后取得的关键指标提升如下:

  • ✅ Token使用量削减:60-97%(平均降幅超95%)
  • ✅ 响应速度提升:5-50倍
  • ✅ 推理成本降低:90-99%
  • ✅ 答案精准度:93%(作为对比,纯向量搜索精度仅为59%)

QMD的核心优势可概括为:

  • ✅ 完全开源免费
  • ✅ 数据绝对本地化 - 模型、索引及全部数据均在本地运行,确保隐私与安全
  • ✅ 混合检索架构 - 融合BM25关键词匹配、向量语义搜索与LLM重排序三层算法
  • ✅ 零API消耗 - 内置高性能本地模型,彻底摆脱云端配额限制
  • ✅ 原生Agent支持 - 兼容MCP协议,专为自动化AI工作流设计

其技术栈基于TypeScript与Bun运行时,利用node-llama-cpp驱动本地模型。检索层采用三步流水线:首先进行BM25全文快速筛选,接着通过向量嵌入进行语义对齐,最后交由轻量级LLM对候选结果进行智能重排序。所有模型均以GGUF格式在本地离线运行。

核心资源链接:

  • QMD GitHub: https://github.com/tobi/qmd
  • OpenClaw官网: https://openclaw.ai

前置条件

自OpenClaw 2026.2.2版本起,该系统已原生集成QMD作为可选的记忆后端。这套由顶尖工程师打造的语义搜索引擎,为AI智能体的长期记忆与知识召回效率带来了革新。

首先,请通过终端命令确认你当前的OpenClaw版本:

openclaw -v

若版本号低于2026.2.2,你需要先将其更新至最新稳定版,以解锁QMD的全部功能。

安装QMD

1、安装QMD

主流方式是使用npm进行全局安装:

# 使用npm安装 npm install -g @tobilu/qmd

若你追求极致的安装与运行速度,可选择Bun作为替代运行时:

# 安装bun curl -fsSL https://bun.sh/install | bash # bun安装qmd bun install -g github:tobi/qmd

安装完成后,务必执行版本验证命令:

终端应输出类似qmd 2.0.1 (bab86d5)的版本信息。

# 查看QMD版本 qmd -v

2、安装SQLite

QMD依赖于支持向量扩展的SQLite数据库环境:

# 更新包列表 sudo apt update # 安装sqlite3 sudo apt install sqlite3 libsqlite3-dev # 验证安装 sqlite3 --version

3、配置QMD

接下来,需要修改OpenClaw的主配置文件~/.openclaw/openclaw.json。操作前,建议进行备份:

cp ~/.openclaw/openclaw.json ~/.openclaw/openclaw.json.bak

编辑配置文件,添加或修改memory配置段:

{"memory": {"backend": "qmd","qmd": {"limits": {"timeoutMs": 8000}}}}

配置参数解析:

backend: "qmd" - 将记忆后端切换至QMD引擎。

timeoutMs: 8000 - 将检索超时时间设置为8秒(默认4秒在某些复杂查询下可能不足)。

4、重启openclaw

重启服务后,OpenClaw将自动启用QMD处理所有记忆检索请求。系统具备优雅的降级机制:若QMD运行异常,将无缝回退至内置的SQLite记忆系统,保障服务连续性。

# 重启OpenClaw Gateway服务 openclaw gateway restart

5、验证QMD是否正常

方法1:查看OpenClaw日志

通过日志确认QMD后端已成功加载并初始化:

# 查看OpenClaw日志 openclaw logs --follow # 查看OpenClaw与qmd相关的日志 openclaw logs | grep qmd

寻找包含qmd memory的关键日志行,例如:info gateway {"subsystem":"gateway"} qmd memory startup initialization armed for agent "main"

方法2:检查QMD状态

# 查看QMD状态 qmd status

正常输出示例如下图所示:

你可能会看到一些提示信息,这通常是运行状态日志,而非错误报告。

QMD在初次启动时会执行以下自适应流程:

尝试GPU加速 - 自动编译支持Vulkan后端的llama.cpp。

编译失败 - 大多数系统默认未安装Vulkan图形驱动。

自动回退 - 无缝切换到纯CPU计算模式(falling back to no GPU)。

这是预期内的标准行为,QMD在CPU模式下仍可全功能工作。

如需启用GPU加速以提升检索速度,请手动安装Vulkan驱动:

# Ubuntu/Debian sudo apt install vulkan-tools libvulkan-dev # 安装后重启qmd服务,引擎将自动重新编译以启用GPU支持

方法3:实际测试

最直接的验证方法是与OpenClaw进行对话,询问关于历史会话的具体细节,亲身感知其响应速度与答案准确度的提升。

卸载QMD

1、修改配置

编辑配置文件~/.openclaw/openclaw.json,将记忆后端改回sqlite:

{"memory": {"backend": "sqlite"// 恢复为默认的SQLite后端}}

你也可以选择直接删除整个memory配置块,系统将自动使用SQLite作为默认后端。

2、重启openclaw

# 重启Gateway openclaw gateway restart # 等待3秒后检查状态 sleep 3 && openclaw gateway status

3、卸载QMD包

# npm方式卸载 npm uninstall -g @tobilu/qmd # 或bun方式卸载 bun uninstall -g @tobilu/qmd

4、清理qmd数据(可选但建议)

删除QMD生成的索引与缓存文件,彻底释放磁盘空间:

# 查看qmd数据占用 du -sh ~/.openclaw/agents/main/qmd/ # 删除qmd数据目录 rm -rf ~/.openclaw/agents/main/qmd/ # 验证删除 ls -la ~/.openclaw/agents/main/ | grep qmd # 应无输出(目录已不存在)

5、验证

执行记忆搜索测试,确认系统已完全回退到默认模式:

# 方法1:使用OpenClaw CLI openclaw memory search "测试关键词" # 方法2:在对话中让AI执行 # 发送消息:帮我搜索memory中的"安全检查"

常见问题排查

问题1:qmd命令未找到

which qmd

输出空

解决:

npm install -g @tobilu/qmd

问题2:Bun版本的QMD报错

错误信息:/home/zilong/.bun/bin/qmd: 29: exec: bun: not found

解决:切换到npm版本

# 备份bun版本 mv ~/.bun/bin/qmd ~/.bun/bin/qmd.bun.bak # 创建符号链接到npm版本 ln -s ~/.nvm/versions/node/v25.8.0/bin/qmd ~/.bun/bin/qmd # 验证 qmd --version

问题3:缺少C++编译器

错误信息:ERROR OMG C++ Compiler toolset is not available. Install proper compiler toolset with your package manager, eg. 'sudo apt-get install g++'.

解决:

# Ubuntu/Debian sudo apt install build-essential g++

或选择忽略(CPU模式仍可工作):QMD会自动回退到CPU模式,仅牺牲部分编译期性能。

问题4:首次启动慢

现象:第一次使用QMD时,需要下载模型(约2GB),耗时较长。

解决:耐心等待完成,后续使用会很快。模型下载位置:~/.cache/qmd/models/

问题5:QMD更新失败

查看日志发现:warn memory {"subsystem":"memory"} qmd update failed

解决:

# 手动更新QMD qmd update # 重新嵌入 qmd embed -f

问题6:qmd: 22: exec: node: not found

问题原因

OpenClaw以守护进程运行,没有加载nvm的环境变量,所以找不到node。

解决方案

在系统路径创建node符号链接(指向v22):需要sudo权限。请在终端手动执行:

# 在系统路径创建node符号链接(指向v22) sudo ln -s /home/zilong/.nvm/versions/node/v22.22.1/bin/node /usr/local/bin/node # 重启openclaw openclaw gateway restart

问题7:找不到config.json文件

问题描述

error [tools] read failed: ENOENT: no such file or directory, access '/home/zilong/.openclaw/agents/main/qmd/config.json'

问题原因:

~/.openclaw/agents/main/qmd/config.json文件缺失

解决方法:

创建了一个空的JSON文件{}

菜鸟下载发布此文仅为传递信息,不代表菜鸟下载认同其观点或证实其描述。

展开
智夺军旗
智夺军旗
类型:策略战棋 运营状态:公测 语言:简体中文
策略 益智 AI
前往下载

相关文章

更多>>

热门游戏

更多>>

手机扫描此二维码,

在手机上查看此页面

关于本站 下载帮助 版权声明 网站地图

版权投诉请发邮件到 cn486com#outlook.com (把#改成@),我们会尽快处理

Copyright © 2019-2020 菜鸟下载(www.cn486.com).All Reserved | 备案号:湘ICP备2023003002号-8

本站资源均收集整理于互联网,其著作权归原作者所有,如有侵犯你的版权,请来信告知,我们将及时下架删除相应资源