进阶教程

WorkBuddy实战笔记：自定义模型接入与远程中转31轮精华

2026-05-31

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

今天分享的是 WorkBuddy 用户在一次涉及 31 轮对话的深度实践中总结出的真实经验。如果你在

今天分享的是 WorkBuddy 用户在一次涉及 31 轮对话的深度实践中总结出的真实经验。如果你在长期使用这款工具时也遇到“对话一长就翻不到头”“积分蹭蹭往下掉”“想用自己的模型但不知从何入手”等痛点，这篇文章会带来不少启发。

先给出几个关键判断：通过自定义模型接入可以彻底摆脱积分消耗；阿里云 DashScope 一套配置即可同时调用通义千问与 DeepSeek；云服务器中转方案虽然需要一定的网络基础，但搭建完成后，能随时随地远程调用本地工作站上的大模型。而一个简单的 HTML 对话纪要文件，辅以自定义指令自动维护，就能从根本上解决“长对话回溯慢”的难题。

前言：为什么要整理这些笔记？

WorkBuddy 用户都有这样的体验：在一个任务中进行多次对话后，内容越堆越多，想回顾之前讨论过的配置参数、踩过的坑，只能不断向上翻找。上下文越长，AI 处理速度越慢，积分消耗也越高。

有人在同一个工作空间里连续进行了 31 轮对话，话题涉及任务管理、自定义模型配置、云服务器中转、积分攻略等，内容越来越丰富，但快速定位之前的信息也越来越难。

于是这位用户和 AI 助手共同设计了一个方案——用 HTML 文件构建“对话纪要”，每轮对话自动追加摘要，随时预览，一秒锁定任意一轮的关键信息。这个方案的效果远超预期。本文从这个方案出发，将 31 轮对话中提炼出的所有实操经验系统整理出来。

设计思路

一、对话纪要方案：告别无尽滚动

1.1 问题：长对话的三个痛点

痛点	说明
回溯慢	31 轮对话中查找特定话题需花费大量时间
积分浪费	每次发送消息，AI 需重新读取全部历史上下文，对话越长开销越大
跨任务无法共享	WorkBuddy 各任务工作空间互相隔离，切换任务后之前积累的经验无法复用

1.2 解决方案：独立 HTML 对话纪要

核心思路很直接：创建一个独立的 HTML 文件（例如 conversation-log.html），每轮对话结束后，AI 自动追加一条记录——包含轮次、时间戳、你的提问摘要、AI 回复要点。点击任意条目可展开或收起详细内容。预览功能在右侧面板实时刷新，随时查看。

效果示意：

点击前：

【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek？自定义模型

点击后：

【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek？自定义模型

多宝回复要点：
• 接口地址与通义千问相同
• 仅需修改模型 ID
• 同一 Key 通吃所有模型

1.3 配合自定义指令实现自动维护

在 WorkBuddy 的「设置 → 个性化 → 自定义指令」中添加以下规则：

【规则：对话纪要】每轮对话结束后，更新工作空间下的 conversation-log.html 文件，追加本轮轮次、时间和内容摘要。若文件不存在则自动创建。

新工作空间首次使用时，让 AI 先创建 HTML 模板文件，后续每轮自动追加，无需任何手动操作。

1.4 跨任务的局限

由于 WorkBuddy 每个任务的工作空间目录相互独立，该 HTML 文件仅存在于创建它的工作空间中。其他任务如需类似功能，需单独创建。不过可通过工作空间的记忆文件（MEMORY.md）间接传递关键信息。

二、自定义模型接入：不花积分用 AI

WorkBuddy 内置了多个模型，按积分消耗系数从低到高排列。但如果你有自己的 API Key，完全可以接入外部模型，积分消耗直接变为 0。

2.1 配置方式

配置文件路径为 ~/.workbuddy/models.json（若不存在则手动创建）。

格式如下：

{ "models": [ { "id": "模型ID", "name": "显示名称", "vendor": "OpenAI", "url": "接口地址/v1/chat/completions", "apiKey": "你的API Key", "maxInputTokens": 131072, "maxOutputTokens": 8192 } ] }

配置完成后完全退出 WorkBuddy 再重新启动，底部模型下拉菜单中就会出现自定义模型。

2.2 阿里云 DashScope 接入通义千问

配置项	值
接口地址	https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
API Key	阿里云百炼平台的 Key（sk- 开头）
可选模型	qwen-turbo（快速）、qwen-plus（均衡）、qwen-max（最强）、qwen-coder-plus（代码专精）

2.3 同一个 Key 调用 DeepSeek

阿里云百炼已上架 DeepSeek 模型，接口地址和 Key 与通义千问完全一致，仅需修改模型 ID：

模型 ID	特点
deepseek-v4-pro	最新旗舰，编程/数学/通用最强
deepseek-v4-flash	快速且成本低
deepseek-v3.2	综合均衡
deepseek-r1	深度思考模型，回复前先进行推理

换言之，在 models.json 中可以同时配置通义千问和 DeepSeek，共用同一个 Key，在模型下拉菜单中自由切换。

2.4 两个常见坑

坑	错误写法	正确写法
接口地址缺少 /v1	.../compatible-mode	.../compatible-mode/v1
模型名称与平台不一致	Qwen3-4B	qwen-turbo（必须与平台上的模型 ID 完全一致）

三、云服务器中转远程工作站模型

如果你的高性能工作站上部署了大模型，希望其他设备的 WorkBuddy 也能调用，可以通过云服务器做中转——固定 IP，配置一次即可长期使用。

3.1 整体架构

WorkBuddy → 云服务器(公网固定IP:端口) → SSH加密隧道 → 工作站(本地) → 大模型

3.2 第一步：工作站部署模型服务

无论使用哪种工具（Ollama / LM Studio / vLLM），关键是要让模型监听在 0.0.0.0（所有网卡）而非默认的 127.0.0.1（仅本机）。

工具	配置方法
Ollama	设置环境变量 OLLAMA_HOST=0.0.0.0:11434
LM Studio	在 Server Settings 中将 Host 改为 0.0.0.0

3.3 第二步：建立 SSH 反向隧道

在工作站上执行：

ssh -R 0.0.0.0:11434:localhost:11434 -N user@云服务器IP

关键：必须加上 0.0.0.0: 前缀，否则隧道仅在云服务器的 127.0.0.1 上监听，外部无法连接。

同时需在云服务器上修改 SSH 配置：

# 云服务器上 sudo nano /etc/ssh/sshd_config # 添加或取消注释： GatewayPorts yes sudo systemctl restart sshd

3.4 第三步：隧道自动保活

使用 autossh 替代 ssh，配合 systemd 实现开机自启和断线重连：

autossh -M 0 -o ServerAliveInterval=30 -o ServerAliveCountMax=5 -o ExitOnForwardFailure=yes -R 0.0.0.0:11434:localhost:11434 -N user@云服务器IP

3.5 第四步：加 Nginx Basic Auth 防护

端口暴露在公网上，仅靠防火墙限制 IP 并不够（IP 可能变化、同网段可能存在其他主机）。增加一层应用层认证：

server { listen 11434; auth_basic "Model API"; auth_basic_user_file /etc/nginx/.htpasswd; location / { proxy_pass http://127.0.0.1:11434; proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; proxy_read_timeout 300s; } }

这样任何连接 11434 的请求都必须先输入密码才能放行，IP 改变不影响，同网段的其他主机也无法进入。

3.6 WorkBuddy 侧配置

{ "id": "qwen3:32b", "name": "工作站远程模型", "vendor": "OpenAI", "url": "http://云服务器固定IP:11434/v1/chat/completions", "apiKey": "任意字符串", "maxInputTokens": 32768, "maxOutputTokens": 8192 }

3.7 安全层级总结

层级	防护对象
防火墙限制 IP	随机扫描
SSH 密钥认证	非法建立隧道
autossh 保活	断线丢失
Nginx Basic Auth	IP 变化、同网段主机——均能有效拦截

四、积分攻略：获取与节省

4.1 免费获取积分的渠道

方式	收益	说明
每月固定福利	500 积分/月	自动发放，永久有效
成长计划任务	900 积分（一次性）	新手 + 进阶任务
邀请好友	双方各 500/人	无上限
腾讯云社区发文	500~3000/篇	心得 500，教程 1000，精选 2000

注意：每日签到已于 2026 年 5 月 10 日永久下线。

4.2 积分消耗的三个阶段

阶段	说明	省积分技巧
你的输入	消息 + 历史上下文 + 工具参数	长对话开新会话；一次性说清需求
网络响应体	网页/接口返回内容全量加载	这是大头，直接给精确 URL 比让 AI 先搜索再开启节约一轮
AI 回复	模型生成回答	关闭深度思考模式可节省 2~3 倍

4.3 模型选择对积分的影响

模型	消耗系数	适用场景
MiniMax M2.5	0.18	简单问答，最省
智谱 GLM-4.7	0.23	中等复杂度
DeepSeek V3.2	0.30	复杂推理，比 M2.5 贵 1.67 倍
自定义模型	0	走自己的 API Key

五、几个踩过的坑

5.1 成长计划"模板达人"任务进度不更新

现象	说明
网页端入口仍存在	任务定义未下线
点击后自动打开 WorkBuddy 新任务	链路正常
使用模板后进度条无变化	追踪逻辑断裂

大概率是版本升级后模板内部标识改变，成长计划读取的是旧标识，无法匹配。这属于客户端与服务器端之间的追踪 bug，建议前往腾讯云开发者社区发帖反馈，等待官方修复。

5.2 自定义指令对新会话才生效

自定义指令在会话创建时注入系统提示。如果先创建会话再写指令，当前会话不会生效。写好指令后必须新建会话才能验证效果。

5.3 对话框底部盾牌图标

盾牌形状并带有勾号的图标，点击后有两个选项：

权限级别	说明
默认权限	沙箱受限模式，仅能操作工作空间目录内文件
完全权限	放开限制，可访问更广范围的文件和操作

日常使用保持默认权限即可，需要操作工作空间外文件时再切换为完全权限。

5.4 CodeBuddy CLI Agent SDK 集成

WorkBuddy 系列还包含 CLI 形态（CodeBuddy Code），并提供了 Agent SDK（TypeScript / Python），可嵌入到自己的应用中。结合外部 ASR 语音识别服务，能够实现“语音输入 → 文字 → AI 处理 → 结果输出”的完整链路。

总结

31 轮对话提炼出的核心经验：

对话纪要：用独立 HTML 文件记录每轮要点，解决长对话回溯慢、积分浪费的问题，配合自定义指令实现自动维护
自定义模型：一个阿里 DashScope Key 同时接入通义千问和 DeepSeek，接口地址相同，仅改模型 ID
远程中转：SSH 反向隧道 + autossh 保活 + Nginx Basic Auth，固定 IP 安全访问工作站模型
积分管理：用便宜模型省积分，自定义模型零积分，社区发文赚积分
避坑：自定义指令需新会话才生效，模板任务有 bug 需反馈官方

希望这些实战经验对你有帮助。

来源：互联网

上一篇 BPE分词器训练优化：初版实现与后续方向分析 下一篇 最新前端AI技术情报盘点｜本周精选

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。