菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 提示词 > 前端工程数据集清洗方案结构化提示词

前端工程数据集清洗方案结构化提示词

2026-05-18
阅读 0
热度 259

本文为前端工程数据集清洗方案提供了一套结构化提示词,旨在帮助开发者或数据工程师系统化地处理前端日志、用户行为等原始数据,生成高质量、可直接用于分析或模型训练的结构化数据集。

前端工程 数据集清洗 数据清洗
提示词内容

提示词内容

可直接复制使用
角色定义与任务定位
请以“前端数据质量工程师”或“专注于数据清洗的前端开发者”的身份,使用本提示词方案。您的核心目标是:将前端工程中收集到的原始、杂乱、非结构化的数据(如用户交互日志、性能指标、错误报告等),通过系统化的清洗、转换与结构化流程,转化为可靠、一致、可直接用于业务分析、可视化或机器学习模型训练的高质量数据集。
适用场景

清洗前端监控平台(如Sentry, LogRocket)收集的原始错误日志与堆栈信息。
处理用户行为分析工具(如埋点数据)中的非标准、重复或缺失字段。
规范化来自不同浏览器、设备或版本的前端性能指标(如FP, FCP, LCP)。
为训练前端AI辅助工具(如代码补全、错误预测)准备结构化的代码与日志数据集。

核心提示词
以下提示词组合可直接用于指导数据清洗流程的生成或自动化脚本的编写:

输入:原始前端错误日志JSON数组;输出:按错误类型、发生页面、浏览器版本分组统计的清洗后CSV。
步骤:1. 过滤掉“info”级别日志;2. 解析堆栈信息中的文件路径与行号;3. 统一时间戳为ISO 8601格式;4. 对错误信息进行关键词提取与分类。
关键操作:去除重复的相同会话ID事件、填充缺失的userAgent字段、将数值型字符串转换为Number类型、将嵌套对象扁平化。
验证规则:确保所有URL字段符合格式、所有时间戳在合理时间范围内、关键事件字段不存在空值。

风格方向

逻辑风格:流程图表式思维,强调步骤的先后顺序与条件分支,呈现清晰的“输入-处理-输出”管道。
视觉风格:采用干净、现代的科技感界面隐喻,如数据流管道图、高亮的变化字段、从混乱到整齐的对比视图。
代码风格:伪代码或具体函数片段风格,突出关键清洗函数(如filter、map、reduce、正则匹配)的使用。

构图建议

主视觉:左侧为杂乱、颜色多样的原始数据块(如扭曲的JSON文本、破碎的日志行),右侧为排列整齐、颜色统一的结构化表格或数据库图标,中间由一道清晰的“清洗管道”连接。
信息布局:采用分屏或步骤轮播图形式,依次展示“原始数据发现问题”、“应用清洗规则”、“验证数据质量”、“输出结构化结果”四个关键阶段。
镜头语言:使用俯视视角展示整体数据流全景,配合特写镜头聚焦于某个具体字段的转换过程(如从“NaN”变为“0”)。

细节强化

数据状态可视化:用不同颜色与形状标识数据问题:红色警告三角形代表缺失值,黄色感叹号代表异常值,绿色对勾代表已验证字段。
色彩方向:原始数据区使用灰暗、混杂的色调;处理过程使用蓝色调(象征逻辑与流程);最终输出区使用绿色或干净的浅色调(象征完成与可靠)。
材质细节:原始数据呈现为粗糙的纸张或破碎的像素块;清洗后的数据呈现为光滑的玻璃面板或规整的电子表格质感。
氛围元素:可添加微弱的代码背景光晕、象征数据流动的虚线或箭头、代表自动化运行的齿轮或循环图标。

使用建议

将“核心提示词”部分的具体步骤作为编写Node.js/Python清洗脚本的大纲,或直接转化为Jupyter Notebook的单元格。
在构思可视化图表(如数据质量报告)时,参考“构图建议”与“细节强化”中的视觉描述来设计图例、布局和颜色方案。
根据实际数据源类型(日志、性能指标、用户行为),从“核心提示词”中选取并组合相关的“关键操作”与“验证规则”。
本方案旨在提供结构化思路,实际使用时需替换示例中的具体字段名(如“userAgent”)为您项目中的真实字段。
同类提示词

同类提示词