数据分析数据集清洗方案完整流程提示词
这是一份为数据分析师与数据工程师设计的结构化提示词方案,旨在将“数据集清洗”这一专业流程转化为清晰、可执行的视觉化指导框架,帮助用户快速生成用于流程说明、团队培训或方案展示的专业图表与信息图。
数据分析
数据集清洗
数据清洗
提示词内容
可直接复制使用
角色定义与任务定位 请以“数据流程架构师”或“数据质量管理专家”的身份,使用本提示词方案。您的核心目标是:系统性地将“数据集清洗”的完整流程,转化为一套逻辑清晰、视觉直观的图表或信息图,用于方案沟通、流程标准化或团队培训,确保技术流程的可理解性与可执行性。 适用场景 为新项目制定标准数据预处理(ETL)流程文档。 制作面向业务或技术团队的数据清洗培训材料。 在数据分析报告或项目方案中,可视化展示数据质量保障环节。 设计数据治理看板或知识库中的标准操作流程(SOP)图示。 核心提示词 可直接用于图表生成或视觉构思的核心提示词组合: “数据清洗完整流程图,包含数据获取、质量评估、处理操作、验证与加载阶段” “信息图风格,展示数据集清洗的关键步骤:缺失值处理、异常值检测、格式标准化、重复值删除、一致性检查” “专业商务图表,对比清洗前后数据质量指标(如完整性、准确性、一致性)的显著提升” “分步式图解,详细说明如何处理数据中的重复记录、错误格式与逻辑矛盾” 风格方向 专业商务风:使用清晰的线条、模块化布局、统一的色系(如蓝色系、灰色系),搭配简洁的图标和数据标签。 技术图解风:采用流程图或架构图形式,使用箭头明确步骤流向,辅以简要的代码片段或公式说明关键处理逻辑。 扁平化信息图:将每个步骤转化为一个视觉模块,用比喻性图标(如漏斗代表筛选、刷子代表清洗、放大镜代表检查)增强识别度。 构图建议 采用从左到右或自上而下的线性流程布局,明确体现步骤的先后顺序。 使用泳道图区分“原始数据”、“处理操作”、“输出结果”等不同责任区域。 在关键决策点(如“是否满足质量要求?”)设置分支箭头,体现流程的判断逻辑。 预留空间放置清洗前后的数据样本对比,或关键质量指标(KPI)的变化图表。 细节强化 色彩提示:用红色/橙色标注“问题数据”(如异常值、缺失值),用绿色/蓝色标注“已处理数据”或“清洁数据”。 元素提示:加入数据库图标、筛选漏斗、警告三角(代表异常)、对勾符号(代表验证通过)、刷新箭头(代表转换)等视觉元素。 氛围提示:整体氛围应严谨、干净、有序,避免杂乱装饰。可通过轻微的科技感网格或渐变背景提升专业度。 文本提示:在图表旁标注简短的技术要点,如“使用插值法填补缺失值”、“基于3σ原则识别异常值”。 使用建议 生成图像时,将“核心提示词”中的语句与“风格方向”、“构图建议”结合使用,例如:“专业商务风的信息图,展示数据清洗完整流程图,重点突出缺失值处理与异常值检测步骤”。 可根据具体数据集类型(如时间序列、用户行为数据)调整“核心提示词”,加入“时间戳对齐”、“用户ID去重”等具体操作。 本方案侧重于流程可视化,如需生成具体代码,可在“细节强化”部分补充“伪代码示例”或“Python pandas代码片段”等要求。 最终产出物应服务于明确的沟通目的,确保视觉逻辑与技术逻辑一致,便于团队成员快速理解与执行。