工业制造图片信息提取完整流程提示词
这份提示词方案将“工业制造图片信息提取流程”转化为一套可直接用于视觉生成的指令,适合技术图示、流程说明图等场景,帮助用户快速输出清晰、专业的工业视觉内容。
工业制造
图片信息
信息提取
提示词内容
可直接复制使用
角色定义 你应以工业视觉设计师与技术图示策划师的身份,围绕“工业制造场景中的图片信息提取完整流程”这一核心,输出一组可用于图像生成或视觉化表达的提示词。目标是让生成的图像清晰展示从原始工业图片到结构化信息输出的全过程,包括采集、预处理、特征识别、数据提取等关键步骤,并具备专业、直观、可复用的技术图示风格。 适用场景 工业制造领域的技术文档插图、操作指南、培训手册 工厂自动化系统、机器视觉项目的流程展示页面 信息提取算法或OCR系统的概念示意图、幻灯片演示 产品说明书中关于数据采集与分析的视觉辅助内容 核心提示词 以下提示词可直接复制用于图像生成工具(如Midjourney、Stable Diffusion、DALL·E 3),根据实际需要调整细节参数: “An industrial manufacturing scene with a close-up view of a production line. A series of images are being captured by a camera module above the conveyor belt. Visualize a complete information extraction workflow: step 1 – image acquisition (camera + object), step 2 – preprocessing (noise reduction, binarization), step 3 – region detection (bounding boxes around labels and barcodes), step 4 – OCR or symbol recognition with text highlighted, step 5 – structured data output shown as a digital table floating above. Clean technical illustration style, isometric view, white background, blue and gray color scheme, labeled arrows connecting each step, no people, photorealistic but diagrammatic.” Alternatively: “Flat vector diagram of the image information extraction pipeline for industrial manufacturing. From left to right: raw product image → preprocessed grayscale → feature map with rectangles → recognized digits/letters → final JSON data format. Use neutral cool tones, minimal shading, clear step labels, 2D front view, high contrast for readability.” 风格方向 技术图示风格:干净、精准,类似工程手册中的示意图,线条清晰,无冗余装饰 工业写实+标注:真实感的工厂背景配合半透明数据叠加层,既有场景感又有信息重点 等距/斜角视图:适合展示流程顺序,视觉层次分明 色彩倾向:以冷灰色、蓝色、白色为主,适当使用橙色或绿色突出关键识别区域 构图建议 流程式排列:采用从左到右或从上到下的时间线布局,每个步骤用小卡片或独立模块展示,箭头连接 主视觉+细节放大:左侧展示整体工厂产线场景,右侧放大显示某个产品的图片及信息提取细节 分屏对比:上半部分为原始图像,下半部分为提取后的结构化数据表格,中间用虚线流程连接 镜头语言:俯视45度或正前方平视,保证所有文字和标签清晰可读,避免透视变形 细节强化 在图像中增加以下视觉元素:摄像头图标、二维码/条形码、数字仪表盘、数据字段(如产品ID、日期、批号) 使用半透明高亮框圈出被提取的信息区域,并附上小标签如“OCR result: A12345” 在流程末尾添加一个类似手机屏幕或电脑界面的外框,显示最终提取的信息列表 材质上:金属质感(设备)、磨砂玻璃质感(数据面板)、哑光白(背景) 光照:均匀漫反射,避免强阴影干扰文字识别 使用建议 如果使用Midjourney,建议在提示词末尾加入“--ar 16:9 --v 6”以适配文档横版布局 对于需要精确文字显示的场景(如OCR结果),优先选择DALL·E 3或Stable Diffusion + ControlNet(配合Canny) 可根据实际工业类型替换“产品”为具体物件(如电路板、零件、包装箱),并调整对应标签内容 如需生成多张步骤图,可将核心提示词按步骤拆分,每张图聚焦一个环节,配合同一色彩系统保持统一 生成后可用于PPT、Notion、技术报告等,直接引用或二次裁剪标注