实战型测试工程数据处理脚本提示词
针对测试工程中数据处理脚本的设计与编写,提供一套实战型提示词方案,帮助测试工程师快速生成符合专业规范、具备可维护性与扩展性的数据处理脚本。
测试工程
数据处理
脚本编写
创意表达
专业版
提示词内容
可直接复制使用
角色定义(任务定位) 以测试工程专家身份,目标为设计实用、高效、可复用的数据处理脚本。这套提示词面向需要处理测试数据生成、清洗、转换、验证的工程场景,要求脚本具备健壮的错误处理、清晰的日志输出、统一的接口规范,并能够直接嵌入自动化测试框架或CI/CD流水线。 适用场景 自动化测试数据准备:从数据库、文件、API批量提取或生成测试用例数据 日志与执行结果解析:提取关键字段、聚合统计、生成测试报告中间数据 性能测试数据模拟:构造高并发下的参数组合、边界值、压力数据 接口测试数据驱动:将Excel/CSV/JSON数据源转化为可循环执行的测试数据迭代器 测试环境数据清理与快照:按规则过滤、备份、恢复测试数据 核心提示词(可直接复制使用) 基础模板:“请用Python编写一个数据处理脚本,实现以下功能:从读取测试数据,执行操作,输出到,要求添加函数注释、异常捕获和日志记录,并支持命令行参数配置输入输出路径。” 数据生成:“生成一个用于性能测试的批量数据生成器,支持指定数据条数、字段类型(整数、字符串、时间戳)、取值范围和空值概率,输出为CSV格式,每写入1000条打印一次进度。” 清洗规则:“编写一个测试数据清洗脚本,自动识别并处理以下情况:缺失值填充(均值/众数/固定值)、格式不一致(日期统一为ISO 8601)、异常值截断(基于3sigma或IQR),并记录每次修改的详细日志到单独文件。” 比对验证:“实现两个版本测试结果数据集的结构化比对,支持按主键匹配、差异字段高亮输出,生成差异明细表(包含原始值、新值、变更类型),输出为Excel格式,并自动添加条件格式标记。” 接口数据驱动:“将接口测试用例(包含请求参数、预期状态码、期望响应字段)从YAML配置文件读取,动态生成pytest参数化测试数据,每个用例执行后自动将实际结果回写入文件作为快照。” 风格方向 专业严谨:代码必须遵循PEP 8规范,变量/函数命名体现业务含义,关键逻辑处添加TODO标记 可维护性优先:采用面向函数或类封装,每个功能模块独立,主流程不超过50行 防御式编程:对输入参数进行类型断言和边界检查,对文件读写、网络请求等IO操作设置重试机制 可观测性:统一使用logging模块,区分INFO/DEBUG/ERROR级别,支持按文件大小轮转日志 配置驱动:所有可变参数(路径、阈值、开关)通过配置文件或环境变量注入,避免硬编码 构图建议(适用于脚本逻辑可视化、文档插图) 数据流图:使用从左至右的流程图展示“输入源→数据读取→清洗/转换→校验过滤→输出目标”,每个环节标注关键函数名 决策树:若脚本包含多逻辑分支(如根据数据类型走不同处理路径),用树状图展示判断条件与对应处理模块 状态转换图:对于需要多步骤迭代的数据(如分批处理、断点续传),用状态机图表示“初始化→处理中→暂存→继续→完成” 时序对比表:若脚本输出差异报告,建议使用表格型可视化,左列原数据、右列新数据、差异字段用颜色高亮(绿/红) 细节强化 异常场景覆盖:脚本需专门处理空文件、编码错误、字段缺失、数据量过大导致内存溢出等情况,并返回明确的错误码 数据一致性检查:在转换前后增加行数校验、sum校验、Hash校验,确保数据未被意外修改 性能边界:对大数据集(>100万行)使用分批迭代器和生成器,避免一次性加载;关键循环内使用向量化操作(pandas/numpy) 环境隔离:提示词中明确要求使用虚拟环境中requirements.txt管理依赖,并在脚本开头检查关键库版本 单元测试兼容:脚本核心函数应设计为可import状态,搭配pytest编写单元测试用例(正常值、边界值、异常值) 使用建议 集成方式:将脚本直接放在测试项目scripts/目录下,通过main函数入口结合argparse接收参数,方便在Jenkins或GitLab CI中调用 版本管理:每次修改后在文件头更新版本号与变更说明,配合Git Tag标注发布点 注释约定:在关键逻辑前使用# type: ignore等类型注释,在类/函数Docstring中写明输入输出示例 复用扩展:将通用的数据读取、写入、日志模块抽离为独立工具类(如DataLoader、LoggerSetup),后续同类脚本直接继承或导入 输出检验:首次运行后对比人工标注的小样本数据,确认脚本逻辑正确后再投入全量使用