进阶版爬虫采集技术博客写作提示词
本提示词方案专为技术博客作者设计,用于产出高质量的进阶版爬虫采集技术文章。
爬虫采集
技术博客
博客写作
实战应用
提示词内容
可直接复制使用
角色定义与任务定位 以资深爬虫工程师与技术博客作者的双重身份,面向已掌握基础爬虫知识的读者,撰写一篇进阶版爬虫采集技术博客。目标是系统梳理高并发、反爬应对、分布式采集等实战技巧,提供可复用的代码片段与避坑指南,帮助读者从“能用”进化到“好用”。 适用场景 技术内容平台(如CSDN、掘金、知乎专栏)发布进阶教程 个人技术博客或公众号技术干货系列 企业内部技术分享或新人培训材料 爬虫项目文档中的最佳实践总结 核心提示词 为生成博客正文,可直接复制以下提示词模板,填入具体主题后使用: “请以‘进阶爬虫工程师’口吻,撰写一篇主题为【XXX】的技术博客。要求包含:1) 背景与痛点;2) 核心技术解析;3) 完整代码实现(Python/Scrapy);4) 常见问题与解决方案;5) 性能对比数据。语言专业但不晦涩,适当使用代码块与注释。” “生成一篇博客大纲,聚焦【动态渲染页面采集】或【代理IP池管理】等进阶话题,按照‘问题-原理-实现-优化’结构组织。” “为以下技术点配一段200字左右的说明文字,要求包含实际踩坑案例:request重试机制与超时设置。” 同时,为博客封面或插图生成视觉提示词: “一张技术风格的流程图,展示爬虫请求、反爬检测、IP切换、数据解析的闭环,使用蓝色和灰色配色,简洁线条,适合作为博客题图。” “一张代码截图风格图片,深色背景高亮Python代码,旁边有注释说明,风格类似VS Code Carbon,比例16:9。” 风格方向 技术博客风格:采用简洁、清晰的文档式排版,代码段使用等宽字体,关键参数加粗或高亮。 视觉风格:配图采用扁平化信息图或真实代码截图,避免花哨背景;封面图建议使用深蓝/深灰科技色,搭配简洁白字标题。 语言风格:中文技术写作,第一人称“我”或“我们”,包含真实项目经验叙述,避免教科书式灌输。 构图建议 代码部分:采用左右分栏,左栏为代码,右栏为逐行注释;或使用图片形式展示代码片段,上下留白。 流程图:使用纵向或横向流程图,节点用圆角矩形,连接线用箭头,关键步骤添加数字标注。 数据对比:使用表格或柱状图直观展示不同方案(如单线程 vs 多线程 vs 异步)的耗时/成功率。 封面图:中央放置爬虫相关图标(如蜘蛛网、齿轮、数据流),四周留白,标题置于下方。 细节强化 强调状态码处理(如429、503)、User-Agent轮换、Cookie管理、请求头伪造等反爬应对细节。 突出重复采集去重策略(Bloom Filter / Redis Set)与增量采集实现。 加入错误日志示例与调试技巧,如使用mitmproxy或Charles抓包分析。 性能优化:连接池复用、异步aiohttp、协程池大小调优等具体参数建议。 使用建议 写作前先确定目标读者水平(已掌握基本requests与BeautifulSoup),避免基础过度解释。 每一篇博客聚焦一个核心痛点(如JS渲染、验证码、频率限制),不要贪多。 配图建议使用AI生成工具(如DALL·E、Midjourney)生成标准技术图,prompt可参考核心提示词部分。 发布时做好SEO:标题包含“进阶”、“实战”、“踩坑”等关键词,内链关联其他爬虫文章。