专业版工业制造多模态内容理解提示词
本提示词方案专为工业制造领域的多模态内容理解任务设计,旨在帮助内容分析师或技术文档工程师,从复杂的图文、视频及数据流中精准提取关键信息,并转化为结构化的行业报告或知识文档,提升信息处理效率与决策支持质。
工业制造
多模态理解
信息提取
行业应用
文本创作
提示词内容
可直接复制使用
角色定义与任务定位 请以“工业制造领域多模态内容分析师”或“智能工厂知识管理工程师”的身份,运用本方案。您的核心目标是:系统性地处理来自生产线、设备传感器、操作手册、培训视频及质检报告等多源异构内容,通过深度理解与信息提取,生成可供决策、培训或流程优化使用的结构化知识成果。 适用场景 从设备运行监控视频与实时日志中,归纳故障模式与维护要点。 解析复合型技术文档(图文混排的装配指南、安全规程),提取标准化操作步骤与关键参数。 分析产品质量检测图像与对应数据报表,关联视觉缺陷与工艺参数异常。 整合供应链物料清单、物流视频与仓储记录,可视化追踪物料流转状态与瓶颈。 基于行业研报、专利图表与会议录像,撰写技术动态综述与竞争分析。 核心提示词 可直接用于多模态大模型(如GPT-4V, Gemini等)的输入指令组合: 基础指令框架:“请作为工业制造内容分析师,分析所提供的[图像/视频/文本]材料。首先,识别并列出所有关键的实体信息(如设备型号、仪表读数、部件名称、安全标识)。其次,描述各模态内容之间的逻辑关联与矛盾点。最后,以表格形式汇总核心发现,并生成一段用于[故障报告/操作指南/质量分析]的概要陈述。” 针对图文手册:“提取这份《[具体设备名]操作手册》第X页至第Y页中的所有警告图标、步骤序号、扭矩参数及接线示意图描述,并将它们整合为一份分步检查清单。” 针对监控视频:“分析这段时长[Z]分钟的生产线监控视频。请标注出物料在传送带上的拥堵时间点、机械臂的异常抖动片段,并将这些事件与视频时间戳、屏幕角落显示的实时产量数据关联起来,指出潜在的生产效率损失环节。” 风格方向 文本输出风格:采用严谨、客观、条目化的技术报告风格。避免文学性修饰,优先使用专业术语(如“公差范围”、“启停曲线”、“SPC控制图”)。 视觉分析焦点:强调数据关联性与过程追溯。分析图像时,应关注刻度、标签、色彩编码(如红区/绿区)及箭头指示等引导性元素。 信息密度:输出应高密度、结构化,优先使用列表、表格、时间线图(在文本描述中示意)来呈现信息。 构图建议(针对需生成的示意性图像或信息图) 当需要可视化“信息流”时:采用“分层信息图”构图,底层为设备或生产线实景图/示意图,中层叠加数据流箭头与传感器节点高亮,顶层以浮动面板展示关键指标。 当需要对比“正常与异常”状态时:使用“并排对比构图”,左侧为标准状态(标注关键参数正常范围),右侧为异常状态(用醒目的圆圈、箭头高亮缺陷点或异常读数)。 当展示“流程关联”时:采用“中心辐射构图”,中心是核心设备或工艺环节,四周延伸出与之关联的文本报告片段、数据图表缩略图、视频关键帧截图,并用连线标明关系类型(如“导致”、“输入”、“输出”)。 细节强化 参数精确性:务必要求模型提供具体的数值、单位、时间戳和位置描述(如“画面左上角的压力表,读数为3.4MPa”)。 不确定性标注:对于模糊或低质量内容中的信息,指示模型明确标注其置信度或识别不确定性(如“疑似划痕,由于反光无法完全确认”)。 行业规范引用:在输出中关联或提示可能适用的行业标准、安全规范代码(如“ISO 13849”、“GB/T 5226.1”),以增强输出的权威性与实用性。 多模态交叉验证:明确指令模型利用文本描述去验证图像内容,或利用图像中的视觉证据去补充文本缺失的细节,形成闭环校验。 使用建议 分阶段输入:对于复杂任务,采用“先描述整体,再聚焦细节”的两阶段提示。先让模型概述全部内容,再针对概述中提到的特定疑点或重点,提供原始材料的高清片段进行深度分析。 提供上下文:在提示词开头简要说明本次分析的业务背景(如“此为季度预防性维护分析的一部分,重点关注传动系统”),能显著提升模型提取信息的关联性与针对性。 迭代优化:首次输出后,可将结果作为新的上下文,追加诸如“请根据以上分析,推测可能导致[某个具体现象]的三种最常见根本原因”的提示,进行深度挖掘。 格式指定:明确指定输出格式(如“Markdown表格”、“JSON结构”、“项目符号列表”),便于后续知识库的直接录入与系统集成。