WorkBuddy实战笔记:自定义模型接入与远程中转31轮精华
摘要
今天分享的是 WorkBuddy 用户在一次涉及 31 轮对话的深度实践中总结出的真实经验。如果你在
今天分享的是 WorkBuddy 用户在一次涉及 31 轮对话的深度实践中总结出的真实经验。如果你在长期使用这款工具时也遇到“对话一长就翻不到头”“积分蹭蹭往下掉”“想用自己的模型但不知从何入手”等痛点,这篇文章会带来不少启发。
先给出几个关键判断:通过自定义模型接入可以彻底摆脱积分消耗;阿里云 DashScope 一套配置即可同时调用通义千问与 DeepSeek;云服务器中转方案虽然需要一定的网络基础,但搭建完成后,能随时随地远程调用本地工作站上的大模型。而一个简单的 HTML 对话纪要文件,辅以自定义指令自动维护,就能从根本上解决“长对话回溯慢”的难题。
前言:为什么要整理这些笔记?
WorkBuddy 用户都有这样的体验:在一个任务中进行多次对话后,内容越堆越多,想回顾之前讨论过的配置参数、踩过的坑,只能不断向上翻找。上下文越长,AI 处理速度越慢,积分消耗也越高。
有人在同一个工作空间里连续进行了 31 轮对话,话题涉及任务管理、自定义模型配置、云服务器中转、积分攻略等,内容越来越丰富,但快速定位之前的信息也越来越难。
于是这位用户和 AI 助手共同设计了一个方案——用 HTML 文件构建“对话纪要”,每轮对话自动追加摘要,随时预览,一秒锁定任意一轮的关键信息。这个方案的效果远超预期。本文从这个方案出发,将 31 轮对话中提炼出的所有实操经验系统整理出来。
设计思路
一、对话纪要方案:告别无尽滚动
1.1 问题:长对话的三个痛点
痛点 |
说明 |
|---|---|
回溯慢 |
31 轮对话中查找特定话题需花费大量时间 |
积分浪费 |
每次发送消息,AI 需重新读取全部历史上下文,对话越长开销越大 |
跨任务无法共享 |
WorkBuddy 各任务工作空间互相隔离,切换任务后之前积累的经验无法复用 |
1.2 解决方案:独立 HTML 对话纪要
核心思路很直接:创建一个独立的 HTML 文件(例如 conversation-log.html),每轮对话结束后,AI 自动追加一条记录——包含轮次、时间戳、你的提问摘要、AI 回复要点。点击任意条目可展开或收起详细内容。预览功能在右侧面板实时刷新,随时查看。
效果示意:
点击前:
【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek?自定义模型
点击后:
【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek?自定义模型
多宝回复要点:
• 接口地址与通义千问相同
• 仅需修改模型 ID
• 同一 Key 通吃所有模型
1.3 配合自定义指令实现自动维护
在 WorkBuddy 的「设置 → 个性化 → 自定义指令」中添加以下规则:
【规则:对话纪要】每轮对话结束后,更新工作空间下的 conversation-log.html 文件,追加本轮轮次、时间和内容摘要。若文件不存在则自动创建。
新工作空间首次使用时,让 AI 先创建 HTML 模板文件,后续每轮自动追加,无需任何手动操作。
1.4 跨任务的局限
由于 WorkBuddy 每个任务的工作空间目录相互独立,该 HTML 文件仅存在于创建它的工作空间中。其他任务如需类似功能,需单独创建。不过可通过工作空间的记忆文件(MEMORY.md)间接传递关键信息。
二、自定义模型接入:不花积分用 AI
WorkBuddy 内置了多个模型,按积分消耗系数从低到高排列。但如果你有自己的 API Key,完全可以接入外部模型,积分消耗直接变为 0。
2.1 配置方式
配置文件路径为 ~/.workbuddy/models.json(若不存在则手动创建)。
格式如下:
{ "models": [ { "id": "模型ID", "name": "显示名称", "vendor": "OpenAI", "url": "接口地址/v1/chat/completions", "apiKey": "你的API Key", "maxInputTokens": 131072, "maxOutputTokens": 8192 } ] }
配置完成后完全退出 WorkBuddy 再重新启动,底部模型下拉菜单中就会出现自定义模型。
2.2 阿里云 DashScope 接入通义千问
配置项 |
值 |
|---|---|
接口地址 |
https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions |
API Key |
阿里云百炼平台的 Key(sk- 开头) |
可选模型 |
qwen-turbo(快速)、qwen-plus(均衡)、qwen-max(最强)、qwen-coder-plus(代码专精) |
2.3 同一个 Key 调用 DeepSeek
阿里云百炼已上架 DeepSeek 模型,接口地址和 Key 与通义千问完全一致,仅需修改模型 ID:
模型 ID |
特点 |
|---|---|
deepseek-v4-pro |
最新旗舰,编程/数学/通用最强 |
deepseek-v4-flash |
快速且成本低 |
deepseek-v3.2 |
综合均衡 |
deepseek-r1 |
深度思考模型,回复前先进行推理 |
换言之,在 models.json 中可以同时配置通义千问和 DeepSeek,共用同一个 Key,在模型下拉菜单中自由切换。
2.4 两个常见坑
坑 |
错误写法 |
正确写法 |
|---|---|---|
接口地址缺少 /v1 |
.../compatible-mode |
.../compatible-mode/v1 |
模型名称与平台不一致 |
Qwen3-4B |
qwen-turbo(必须与平台上的模型 ID 完全一致) |
三、云服务器中转远程工作站模型
如果你的高性能工作站上部署了大模型,希望其他设备的 WorkBuddy 也能调用,可以通过云服务器做中转——固定 IP,配置一次即可长期使用。
3.1 整体架构
WorkBuddy → 云服务器(公网固定IP:端口) → SSH加密隧道 → 工作站(本地) → 大模型
3.2 第一步:工作站部署模型服务
无论使用哪种工具(Ollama / LM Studio / vLLM),关键是要让模型监听在 0.0.0.0(所有网卡)而非默认的 127.0.0.1(仅本机)。
工具 |
配置方法 |
|---|---|
Ollama |
设置环境变量 OLLAMA_HOST=0.0.0.0:11434 |
LM Studio |
在 Server Settings 中将 Host 改为 0.0.0.0 |
3.3 第二步:建立 SSH 反向隧道
在工作站上执行:
ssh -R 0.0.0.0:11434:localhost:11434 -N user@云服务器IP
关键:必须加上 0.0.0.0: 前缀,否则隧道仅在云服务器的 127.0.0.1 上监听,外部无法连接。
同时需在云服务器上修改 SSH 配置:
# 云服务器上 sudo nano /etc/ssh/sshd_config # 添加或取消注释: GatewayPorts yes sudo systemctl restart sshd
3.4 第三步:隧道自动保活
使用 autossh 替代 ssh,配合 systemd 实现开机自启和断线重连:
autossh -M 0 -o ServerAliveInterval=30 -o ServerAliveCountMax=5 -o ExitOnForwardFailure=yes -R 0.0.0.0:11434:localhost:11434 -N user@云服务器IP
3.5 第四步:加 Nginx Basic Auth 防护
端口暴露在公网上,仅靠防火墙限制 IP 并不够(IP 可能变化、同网段可能存在其他主机)。增加一层应用层认证:
server { listen 11434; auth_basic "Model API"; auth_basic_user_file /etc/nginx/.htpasswd; location / { proxy_pass http://127.0.0.1:11434; proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; proxy_read_timeout 300s; } }
这样任何连接 11434 的请求都必须先输入密码才能放行,IP 改变不影响,同网段的其他主机也无法进入。
3.6 WorkBuddy 侧配置
{ "id": "qwen3:32b", "name": "工作站远程模型", "vendor": "OpenAI", "url": "http://云服务器固定IP:11434/v1/chat/completions", "apiKey": "任意字符串", "maxInputTokens": 32768, "maxOutputTokens": 8192 }
3.7 安全层级总结
层级 |
防护对象 |
|---|---|
防火墙限制 IP |
随机扫描 |
SSH 密钥认证 |
非法建立隧道 |
autossh 保活 |
断线丢失 |
Nginx Basic Auth |
IP 变化、同网段主机——均能有效拦截 |
四、积分攻略:获取与节省
4.1 免费获取积分的渠道
方式 |
收益 |
说明 |
|---|---|---|
每月固定福利 |
500 积分/月 |
自动发放,永久有效 |
成长计划任务 |
900 积分(一次性) |
新手 + 进阶任务 |
邀请好友 |
双方各 500/人 |
无上限 |
腾讯云社区发文 |
500~3000/篇 |
心得 500,教程 1000,精选 2000 |
注意:每日签到已于 2026 年 5 月 10 日永久下线。
4.2 积分消耗的三个阶段
阶段 |
说明 |
省积分技巧 |
|---|---|---|
你的输入 |
消息 + 历史上下文 + 工具参数 |
长对话开新会话;一次性说清需求 |
网络响应体 |
网页/接口返回内容全量加载 |
这是大头,直接给精确 URL 比让 AI 先搜索再开启节约一轮 |
AI 回复 |
模型生成回答 |
关闭深度思考模式可节省 2~3 倍 |
4.3 模型选择对积分的影响
模型 |
消耗系数 |
适用场景 |
|---|---|---|
MiniMax M2.5 |
0.18 |
简单问答,最省 |
智谱 GLM-4.7 |
0.23 |
中等复杂度 |
DeepSeek V3.2 |
0.30 |
复杂推理,比 M2.5 贵 1.67 倍 |
自定义模型 |
0 |
走自己的 API Key |
五、几个踩过的坑
5.1 成长计划"模板达人"任务进度不更新
现象 |
说明 |
|---|---|
网页端入口仍存在 |
任务定义未下线 |
点击后自动打开 WorkBuddy 新任务 |
链路正常 |
使用模板后进度条无变化 |
追踪逻辑断裂 |
大概率是版本升级后模板内部标识改变,成长计划读取的是旧标识,无法匹配。这属于客户端与服务器端之间的追踪 bug,建议前往腾讯云开发者社区发帖反馈,等待官方修复。
5.2 自定义指令对新会话才生效
自定义指令在会话创建时注入系统提示。如果先创建会话再写指令,当前会话不会生效。写好指令后必须新建会话才能验证效果。
5.3 对话框底部盾牌图标
盾牌形状并带有勾号的图标,点击后有两个选项:
权限级别 |
说明 |
|---|---|
默认权限 |
沙箱受限模式,仅能操作工作空间目录内文件 |
完全权限 |
放开限制,可访问更广范围的文件和操作 |
日常使用保持默认权限即可,需要操作工作空间外文件时再切换为完全权限。
5.4 CodeBuddy CLI Agent SDK 集成
WorkBuddy 系列还包含 CLI 形态(CodeBuddy Code),并提供了 Agent SDK(TypeScript / Python),可嵌入到自己的应用中。结合外部 ASR 语音识别服务,能够实现“语音输入 → 文字 → AI 处理 → 结果输出”的完整链路。
总结
31 轮对话提炼出的核心经验:
- 对话纪要:用独立 HTML 文件记录每轮要点,解决长对话回溯慢、积分浪费的问题,配合自定义指令实现自动维护
- 自定义模型:一个阿里 DashScope Key 同时接入通义千问和 DeepSeek,接口地址相同,仅改模型 ID
- 远程中转:SSH 反向隧道 + autossh 保活 + Nginx Basic Auth,固定 IP 安全访问工作站模型
- 积分管理:用便宜模型省积分,自定义模型零积分,社区发文赚积分
- 避坑:自定义指令需新会话才生效,模板任务有 bug 需反馈官方
希望这些实战经验对你有帮助。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。