爬虫采集PRD需求文档专业版提示词
本提示词方案专为产品经理与需求分析师设计,旨在提供一套结构化、可执行的指令,用于生成专业、清晰、技术细节完备的爬虫采集类产品需求文档(PRD),确保开发团队能准确理解数据采集的目标、规则与边??。
爬虫采集
PRD
需求文档
提示词内容
可直接复制使用
角色定义与任务定位 请以“资深产品经理兼数据需求架构师”的身份,运用本提示词方案。你的核心目标是:为技术开发团队(特别是数据工程师与爬虫开发工程师)撰写一份逻辑严密、细节清晰、可直接指导开发与测试的爬虫数据采集功能需求文档(PRD)。 适用场景 为新产品功能或数据中台项目定义外部数据采集需求。 规范现有爬虫项目的迭代或重构需求。 向开发团队清晰传递数据源、采集规则、字段定义及合规要求。 作为产品、开发、测试三方对齐需求与验收标准的基准文档。 核心提示词 以下为可直接复制使用的提示词核心结构,请根据具体项目填充【】中的内容: 撰写一份关于【目标数据/网站,如:电商平台商品价格与评论】采集的PRD文档。 文档需包含:1. 项目概述与目标;2. 数据源详情(URL模式、页面类型);3. 待采集数据字段列表(明确字段名、类型、示例与清洗规则);4. 采集频率与触发条件(实时/定时/增量);5. 反爬虫策略应对方案(请求头、代理、延迟设置);6. 数据存储与输出格式(JSON/CSV/数据库表结构);7. 异常处理与监控告警机制;8. 合规与隐私声明(Robots协议、数据使用范围)。 要求文档结构清晰,使用专业术语,对技术实现路径保持中立,但功能边界与验收标准必须明确无歧义。 风格方向 文档风格:采用严谨、客观、条理清晰的科技文档风格。避免营销口吻和模糊描述。 语言调性:使用主动语态和肯定句,例如“系统应采集…”、“当触发XX条件时,执行…”。 视觉化辅助:在文档中建议加入流程图说明采集逻辑,用表格列举字段定义,使结构一目了然。 构图建议(信息架构) 顶层框架:采用“总-分-总”结构。开头明确文档变更记录、目标与范围;中间分模块详述;结尾定义验收标准与附录。 核心模块布局:将“数据字段定义”和“采集流程逻辑”作为文档最核心的视觉焦点区域,用清晰的编号标题和表格呈现。 层次关系:使用多级标题(如1.、1.1、1.1.1)建立严格的逻辑层级,区分功能模块、子功能与具体规则。 细节强化 字段定义:为每个字段提供“字段名”、“中文描述”、“数据类型”、“是否必填”、“示例”及“特殊处理说明”(如去HTML标签、单位换算)。 边界条件:明确说明采集深度(如最多翻页数)、处理动态加载内容的策略(如Selenium渲染条件)、登录态维持方案。 异常枚举:详细列出可能遇到的异常(如IP被封、页面结构变更、数据缺失),并给出对应的处理指令或上报要求。 性能指标:可补充期望的采集成功率、单任务耗时、数据新鲜度等非功能性需求作为验收参考。 使用建议 在使用本提示词生成初稿后,务必与开发工程师就“反爬策略”和“异常处理”等技术细节进行二次核对与细化。 将“核心提示词”部分作为需求启动会的讨论提纲,确保各方对需求框架达成共识后再填充细节。 在PRD中,为每个核心功能点标注唯一的“需求ID”,便于后续的跟踪、测试与版本管理。 提示词中的【】占位符是思考的起点,应替换为具体、无歧义的实例,例如将“数据源详情”具体化为“https://www.example.com/product/* 模式下的商品详情页”。