菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 提示词 > 爬虫采集结构化输出模板实战版提示词

爬虫采集结构化输出模板实战版提示词

2026-06-03
阅读 0
热度 469

本提示词方案专为技术团队设计,用于生成爬虫采集与结构化输出流程的视觉化示意图,帮助直观理解数据流转、字段映射与模板输出关系,可直接用于方案汇报、技术文档或原型演示。

爬虫采集 结构化输出 输出模板 行业应用 完整流程
提示词内容

提示词内容

可直接复制使用
角色定义与任务定位
角色:数据采集架构师 / 技术可视化策划任务定位:以“让爬虫数据从杂乱变为模板化、结构化”为视觉目标,生成一张清晰展示“原始网页→爬虫提取→字段映射→结构化输出(JSON/表格/模板)”全流程的示意图提示词。用户应代入“技术方案讲解者”身份,用这张图帮助开发者或产品经理快速理解数据管道与输出规范。

适用场景

技术方案PPT中展示爬虫系统架构与数据流向
API文档或数据字典中说明字段映射关系
团队内部培训时讲解结构化输出模板的设计逻辑
产品原型演示中呈现数据采集到系统入库的完整链路


核心提示词(可直接复制使用)

An infographic showing the complete pipeline of web scraping to structured output. At the left: a web page with highlighted text pieces (titles, prices, dates). Middle: a scraper engine icon with gears and symbols for extraction rules. Arrows flow into a field mapping table: source element → target field name → data type. Right side: a structured template output area showing JSON format and a clean table row with field headers. Use a professional blue-gray color palette, flat design style, clear directional arrows, and annotation labels for each step.
Include a zoomed inset that demonstrates how a raw HTML snippet gets parsed into a table row: HTML tags → separated text → cleaned value → column assignment. Show the template structure as a card with field names and example values.
Add a small “validation” step between mapping and output: a checkmark icon and a rule list (e.g., “remove whitespace”, “format date”). Emphasize the transformation from unstructured to structured.


风格方向

技术文档风:简洁、直角、无渐变,配色以深蓝、浅灰、白色为主,配合等宽字体样本。
半实物化信息图:爬虫引擎用齿轮+BOT图标,网页用浏览器窗口,输出用代码框+表格,保留工业感。
数据流优先:强调箭头粗细、分层颜色(源数据层→处理层→输出层),降低装饰元素干扰。


构图建议

从左到右三段式布局:左为数据源(网页、API),中为采集与映射引擎,右为结构化输出模板。整体水平排列,底部可加一条时间线或进度条表示流程顺序。
核心焦点:中间的“字段映射表”占据画幅中心,用表格或卡片堆叠形式展示原始字段名→清洗规则→目标字段名→数据类型→示例值。
辅助视觉:在输出模块旁放置一个缩略JSON样例(带语法高亮色块),下方放一个带边框的表格行,表示实际数据库或Excel输出。


细节强化

箭头设计:实线箭头表示数据流,虚线箭头表示元数据/规则传递;箭头颜色随层变化(源数据层用蓝色,映射层用绿色,输出层用紫色)。
文本标注:在每个主要节点旁加小标签,如“原始HTML解析”“正则提取”“字段标准化”“模板渲染”。
材质与质感:爬虫引擎用金属灰质感,网页截图用轻微纸张纹理,模板输出框用半透明代码背景,增强层次。
错误处理暗示:在映射表旁加入一个红色小三角警告图标,旁边注“missing fields → default value”,体现实战容错意识。


使用建议

若用于PPT/Keynote,建议将核心提示词中的构图描述再简化,保留“左中右布局+字段映射表+JSON输出”作为最低配置。
若用于演示技术方案,可额外添加“动态数据流”动画提示(箭头流动感),但提示词中仅需说明静态版本,由设计师自行发挥。
在需要强调“完整流程”时,增加“去重”“反爬处理”等可选节点置于左下/右下角,但不干扰主线。
提示词中的“validation”步骤可根据实际行业(电商、金融、社交)替换字段规则,保持灵活。
同类提示词

同类提示词