实战型智能体开发开源模型微调方案提示词
本提示词方案旨在为智能体开发者与算法工程师提供一套结构化、可落地的开源模型微调实战指南。
智能体开发
开源模型
模型微调
Agent工作流
实战应用
提示词内容
可直接复制使用
角色定义与任务定位 请以“智能体开发架构师”或“模型微调实战专家”的身份,来使用这组提示词。你的核心目标是:为具体的业务场景或研究课题,规划并生成一套可直接执行、高效可靠的开源模型微调方案,以构建或优化具备特定能力的智能体(Agent)。 适用场景 为特定垂直领域(如客服、编程、数据分析)定制专属智能体。 优化现有开源大模型(如 Llama、Qwen、ChatGLM)在特定任务链(Agent Workflow)中的表现。 解决智能体在复杂决策、工具调用或长上下文理解中的性能瓶颈。 撰写技术方案文档、项目开题报告或内部技术分享的核心内容。 核心提示词 以下提示词组合可直接或稍作修改后使用,用于生成具体方案: “针对[具体任务,如:多步骤信息检索与摘要]场景,设计一个基于[开源模型名称,如:Qwen2.5-7B-Instruct]的智能体微调方案,重点提升其在[具体能力,如:工具选择准确性]和[具体能力,如:步骤分解逻辑性]方面的表现。” “详细规划一个实战型微调流程,包括:数据构造策略(侧重[合成数据/真实日志])、微调方法选择(如:LoRA/QLoRA)、训练阶段划分(预训练/指令微调/强化学习)、以及融入Agent工作流(如:ReAct, ToT)的集成测试方案。” “对比分析微调前后,智能体在[某评估基准,如:WebArena]上的性能指标变化,并给出误差分析与迭代优化建议。” 风格方向 技术文档风格:逻辑严密,术语准确,结构清晰,包含目标、方法、实验、结论等标准模块。 实战指南风格:侧重“怎么做”,包含代码片段示例、配置文件关键参数、常见陷阱与调试技巧。 架构图释风格:用文字描述系统架构图、数据流图或工作流程图,强调组件间的交互与数据流向。 构图建议 若需生成配图或进行视觉化思考,可参考以下构图: 流程图构图:以“原始任务输入”为起点,经过“感知-规划-执行-反馈”的智能体循环,最终输出“结果与评估”,突出微调模块在循环中的位置。 对比式构图:左右分栏,左侧展示微调前智能体工作流的断裂点或错误分支,右侧展示微调后流畅、准确的任务执行路径。 分层架构构图:底层是“基础模型层”,中间是“微调适配层”(LoRA等),上层是“Agent框架层”(LangChain等),最上层是“具体应用层”。 细节强化 数据细节:强调数据格式(JSONL)、字段设计(instruction, input, output, tool_calls)、数据清洗与增强的具体方法。 训练细节:明确损失函数、学习率调度策略、批次大小、GPU显存估算。提及使用Deepspeed、FlashAttention等加速技术。 评估细节:设计贴合实战的评估指标,如:任务完成率、单轮对话成功率、平均工具调用次数、人工偏好评分。 部署细节:考虑模型量化(GPTQ/AWQ)、推理加速(vLLM/TGI)、以及如何封装为可调用的API服务。 使用建议 将“核心提示词”中的括号[]内容替换为您的具体项目参数,即可生成初步方案草稿。 在“风格方向”中选择一种作为行文基调,保持全文风格统一。 利用“细节强化”中的要点,检查并充实方案的技术深度,避免流于表面概述。 本方案提示词同样适用于与AI对话,进行头脑风暴、查漏补缺或代码片段生成。