大模型调教对比:DeepMind揭秘Claude平铺与GPT幻梦写作差异
摘要
一项研究开发了StoryScope自动化分析管道,从叙事维度提取特征检测AI写作,准确率达93 2%。A
AI生成故事的底层逻辑与人类创作存在本质差异。即便反复优化提示词,大模型仍受限于其固化的“叙事操作系统”,难以突破预设模板。
5月28日,沃顿商学院教授在社交平台发布了马里兰大学计算机系与Google DeepMind合作的突破性研究成果。研究团队开发的StoryScope自动化分析管道,专门用于“解剖”AI生成故事。实验数据显示:仅从情节结构、主体视角、时间编排等叙事维度提取特征,检测AI写作的准确率高达93.2%。
这意味着,AI在故事创作领域已留下几乎无法消除的“叙事指纹”。

实验规模空前:团队采集上万条写作提示,将人类作者作品与Claude、DeepSeek、Gemini、GPT、Kimi五大模型生成的故事进行对比——总计六万余篇。对比结果揭示了一个核心问题:AI被牢牢锁定在狭窄的默认叙事模板中,且模板边界异常清晰。
具体而言,AI写作暴露了五大底层逻辑缺陷,每一项都直指其“先天局限”。
第一条:过度“说教”倾向。近八成情况下,AI直接在叙事中点明故事主题,甚至让角色在对话中生硬插入哲学讨论——这一比例远超人类作者。人类更擅长将寓意埋藏在情节背后,而AI缺乏含蓄表达的能力。
第二条:叙事结构极度线性,缺乏灵活性。人类作者擅长倒叙、插叙或埋设暗线;AI则一条主线走到底。近八成AI作品缺乏支线情节,结局高度雷同——主角在最后一刻顿悟,走向“伟光正”的大团圆。
第三条:过度堆砌“身体描写”。由于AI缺乏真实情绪体验,无法真正感知“悲伤”或“恐惧”,只能机械地堆砌生理反应和环境隐喻——心跳加速、手心出汗、天空阴沉……结果往往违和感强烈,用力过猛。
第四条:缺乏“读者意识”。人类作者写作时会预设读者存在,适时插入“你猜怎么着”或“且听我细细道来”的互动;AI几乎从不打破第四面墙,始终与读者保持冷冰冰的距离。
第五条:各模型各有“特色缺陷”。研究指出,Claude在情节推进上平淡如水;GPT过度依赖梦境序列强行转折,动辄“原来是一场梦”;Gemini习惯用冰冷的外部视角描述角色,读起来如同人物档案卡片。
研究团队已将全部代码和叙事文本库开源。这面“照妖镜”不仅为文学界提供了穿透表层、去伪存真的工具,更向依赖AI辅助创作者敲响警钟:大模型或许能模仿任何作家的文风笔迹,但永远无法替代人类去经历真实人生——后者才是好故事的终极源泉。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。