产业资讯大模型大模型调教对比

大模型调教对比：DeepMind揭秘Claude平铺与GPT幻梦写作差异

2026-06-01

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

一项研究开发了StoryScope自动化分析管道，从叙事维度提取特征检测AI写作，准确率达93 2%。A

AI生成故事的底层逻辑与人类创作存在本质差异。即便反复优化提示词，大模型仍受限于其固化的“叙事操作系统”，难以突破预设模板。

5月28日，沃顿商学院教授在社交平台发布了马里兰大学计算机系与Google DeepMind合作的突破性研究成果。研究团队开发的StoryScope自动化分析管道，专门用于“解剖”AI生成故事。实验数据显示：仅从情节结构、主体视角、时间编排等叙事维度提取特征，检测AI写作的准确率高达93.2%。

这意味着，AI在故事创作领域已留下几乎无法消除的“叙事指纹”。

实验规模空前：团队采集上万条写作提示，将人类作者作品与Claude、DeepSeek、Gemini、GPT、Kimi五大模型生成的故事进行对比——总计六万余篇。对比结果揭示了一个核心问题：AI被牢牢锁定在狭窄的默认叙事模板中，且模板边界异常清晰。

具体而言，AI写作暴露了五大底层逻辑缺陷，每一项都直指其“先天局限”。

第一条：过度“说教”倾向。近八成情况下，AI直接在叙事中点明故事主题，甚至让角色在对话中生硬插入哲学讨论——这一比例远超人类作者。人类更擅长将寓意埋藏在情节背后，而AI缺乏含蓄表达的能力。

第二条：叙事结构极度线性，缺乏灵活性。人类作者擅长倒叙、插叙或埋设暗线；AI则一条主线走到底。近八成AI作品缺乏支线情节，结局高度雷同——主角在最后一刻顿悟，走向“伟光正”的大团圆。

第三条：过度堆砌“身体描写”。由于AI缺乏真实情绪体验，无法真正感知“悲伤”或“恐惧”，只能机械地堆砌生理反应和环境隐喻——心跳加速、手心出汗、天空阴沉……结果往往违和感强烈，用力过猛。

第四条：缺乏“读者意识”。人类作者写作时会预设读者存在，适时插入“你猜怎么着”或“且听我细细道来”的互动；AI几乎从不打破第四面墙，始终与读者保持冷冰冰的距离。

第五条：各模型各有“特色缺陷”。研究指出，Claude在情节推进上平淡如水；GPT过度依赖梦境序列强行转折，动辄“原来是一场梦”；Gemini习惯用冰冷的外部视角描述角色，读起来如同人物档案卡片。

研究团队已将全部代码和叙事文本库开源。这面“照妖镜”不仅为文学界提供了穿透表层、去伪存真的工具，更向依赖AI辅助创作者敲响警钟：大模型或许能模仿任何作家的文风笔迹，但永远无法替代人类去经历真实人生——后者才是好故事的终极源泉。

来源：互联网

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。