电商服饰多模态内容理解完整流程提示词
本方案提供电商服饰多模态内容理解的完整提示词框架,帮助用户以专业视觉分析员角色,对商品图、标题、描述进行多维度信息提取与语义对齐,实现从原始数据到结构化标签的高效流程。
电商服饰
多模态理解
信息提取
提示词内容
可直接复制使用
角色定义与任务定位 请以“电商服饰多模态内容理解分析师”身份使用本组提示词。你的核心目标是对电商平台服饰商品的多模态数据(包括商品主图、模特图、标题文本、描述文本、属性标签)进行深度理解与结构化信息提取,最终输出可用于检索、推荐、内容管理的标准化关键要素。你需要在视觉与文本之间建立语义对齐,识别款式、材质、色彩、风格、细节特征,并形成可复用的结构化数据。 适用场景 电商平台商品上架审核:自动提取服饰属性,校验信息一致性 智能穿搭推荐:从多模态数据中抽取风格、颜色、适用场景 同款商品匹配:基于视觉+文本特征进行相似度分析 属性标注自动化:批量生成品类、材质、领型、袖长等标签 内容标签体系构建:为搜索和推荐系统提供精细维度的层级标签 核心提示词 以下提示词可直接复制并使用,根据实际输入内容调整细节: “你是一位电商服饰多模态分析专家。请分析输入的服装商品图片及其文本信息。图片中包含【插入图片描述或URL】,标题是【插入标题】,描述是【插入描述】。请以结构化JSON格式输出以下维度信息,每个字段附带置信度评分(0~1):款式(如T恤、连衣裙、外套、裤子)、颜色(主色+辅色,使用标准色卡名称)、材质(如棉、涤纶、羊毛、混纺)、领型(如圆领、V领、立领、翻领)、袖长(长袖、短袖、七分袖、无袖)、裙长/裤长(超短、短、中长、长)、图案(纯色、印花、条纹、格纹、刺绣)、适合季节(春、夏、秋、冬)、风格标签(休闲、通勤、运动、甜美、复古)、细节特征(如口袋、拉链、蕾丝、纽扣、腰带)。若存在穿搭场景,请补充下装/配饰的类型与颜色。确保输出字段完整,缺失字段填写null。” “请对多张同款商品不同角度图片进行综合理解,提取一致的款式与细节,并标注出各图片中特征差异(如颜色变化、摆拍角度不同导致的遮挡部分)。输出合并后的结构化数据。” 风格方向 写实产品摄影风格:强调真实质感、面料纹理与光影细节,提取如哑光、光泽、透明感等视觉属性 模特上身图风格:关注人体姿态、穿搭层次、版型合体度,提取如修身、宽松、落肩等版型信息 平铺图或白底图风格:专注服装本身轮廓与结构,忽略背景干扰,利于提取领型、袖口、下摆等细节 标签信息风格:结合文本中“通勤”“韩版”“北欧风”等关键词,对视觉风格进行标签化映射 构图建议 输入图片建议采用正面全身或半身构图,服装主体占比超过70%,避免过多人脸或配饰干扰 多角度拍摄优先后背、侧面、领口特写、面料细节近景,以覆盖服装全部可提取特征 平铺图要求服装展开平整无褶皱,避免折叠导致轮廓误判;使用纯色背景(白色或浅灰色) 模特图避免复杂背景或动态模糊,保证服装边缘清晰;优先选择站立、正面平视角度 细节强化 面料纹理:需特别关注编织方式(针织、梭织)、表面肌理(起毛、压花、珠片等),输出如“罗纹”“提花”“雪纺皱”等专业术语 装饰细节:识别并描述纽扣材质与数量、拉链类型(金属、树脂、隐形)、刺绣图案与位置、亮片分布等 辅助特征:标签、洗唛、吊牌中的成分或产地信息(若清晰可见)亦应提取 工艺细节:如拼接、压褶、打揽、破洞、磨边等,根据视觉线索输出工艺名称 使用建议 分阶段处理:先对单张图片进行基础属性提取,再综合多张图片做去重与交叉验证,最后融合文本标签修正置信度 词汇标准化:建立内部服饰属性词库(如“圆领”对应“round neck”),避免同义词歧义,提升结构化一致性 质量控制:对置信度低于0.6的字段建议人工复核,特别对复杂印花、混纺材质、模糊图案等易误判项 扩展维度:根据业务需求可加入“适用人群(男/女/童)”“价格区间(低/中/高)”“穿着场合(通勤/聚会/运动)”等标签,但需确保从多模态数据中能合理推断 提示词迭代:定期收集错误案例,调整提示词中强调的细节类型(如当发现大量领型识别错误时,增加“请重点关注领口形状与开合方式”等引导)