OpenAI下一代多模态模型疑似曝光:文字渲染能力“强到离谱”,谷歌迎来真正对手? 这几
这几天,AI圈子又被一则泄露消息搅动了。不少眼尖的研究者发现,OpenAI似乎正在大模型竞技场Chatbot Arena,用多个略显古怪的代号,悄悄测试其新一代多模态模型。可惜的是,当你看到这篇文章时,相关测试入口已经悄然下线,给外界留下了更多的猜测空间。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
OpenAI的图像生成模型,终于要迎来重大更新了吗?算算时间,距离上一代GPT-Image-1.5的推出,已经过去了将近四个月。对于这个日新月异的领域来说,四个月足以发生很多事情。
今天,关于GPT-Image-2的各种讨论和疑似生成效果图,在海外技术社区彻底传开了。
从那些已经流传开的生成Demo来看,最让人瞠目结舌的,莫过于模型在文字渲染能力上的表现。那种精准度和自然度,确实强得有些惊人。

根据目前流出的更多信息,这款疑似GPT-Image-2的模型,曾在测试平台上使用过「maskingtape-alpha」、「gaffertape-alpha」和「packingtape-alpha」这几个充满“胶带”特色的代号。除了前面提到的惊人文字渲染力,它在世界知识理解方面的表现也相当突出。从一些测试结果看,其整体水平或许已经对谷歌的Nano Banana Pro构成了实质性挑战。

例如,它能生成高度精细的人体解剖学前视图,细节把控颇为到位:

社区里的反应相当热烈。有用户直接感叹道:“天哪,OpenAI的GPT-Image-2简直要碾压一切了。还记得以前吗?大家几乎都在嘲笑GPT的图像模型,因为它连一张准确的世界地图都画不出来。但现在,那个时代似乎真的过去了。眼下,它生成的YouTube风格界面图片,几乎已经达到了以假乱真的地步。这进步幅度,确实有些夸张。”

这种感受并非个例。另一位观察者的评论或许点出了关键:“几乎没人意识到,我们可能在一夜之间见证了一次范式转变。过去,我们测试模型还停留在生成单一对象的阶段;而现在,测试对象已经变成了信息密度极高的整张网页。更关键的是,模型居然能完成其中约90%的还原与理解。这一切,竟然都发生在2026年初。”


此外,一个长期被用户诟病的问题似乎也得到了解决。有消息指出:“OpenAI这次终于要解决GPT Image系列模型固有的‘黄色滤镜’问题了。如果属实,这一代模型很可能会一跃成为当前最好的图像模型。”
在图像编辑的一致性上,改进也相当明显。“相比前代V1.5,GPT-Image-2在编辑过程中间出现偏离原图的问题已经显著改善。从对比图可以清晰看到,除了为版权保护而添加的、肉眼不可见的背景噪声水印,编辑后的图像与原图几乎没有任何可察觉的差异。”

甚至出现了一些有趣的“民间鉴定法”。比如:“观察山姆·奥特曼的自拍图,如果生成结果看起来真的非常像他本人,那基本可以确定是Image-2;如果只是有些滑稽的粗略模仿,那大概率还是老的Image-1.5。” 从流出的对比图来看,社区的判断不无道理。

综合来看,技术社区对OpenAI这款新一代图像模型的表现,给出了相当高的认可度。
除了在竞技场的集中测试,迹象表明,GPT-Image-2似乎已经开始向一部分ChatGPT用户进行小范围的灰度测试。

随着更多实测结果的流出,对比的声音也越来越强。有用户直接断言:“Nano Banana Pro被彻底碾压了,GPT-Image-2在各个方面都完成了超越。” 下面这张涉及复杂场景和文字的海报生成对比,似乎佐证了这一观点。

甚至还出现了一些 playful 的创作,比如让奥特曼与马斯克“历史性同框”,展示了模型在理解和组合概念上的能力。
更深入的评价来自业内观察者:“这个模型在图像的真实感和内置文字生成能力上,表现都极其出色。可以说,DeepMind在图像生成领域,终于迎来了一个真正重量级的竞争对手。接下来几个月,非常期待看到它与传闻中的Nano Banana Pro 2进行正面对比,那一定会相当精彩。”

另外,模型的图像增强能力也备受关注。“GPT-Image-2展现出将低分辨率图片提升为高清效果的能力,同时还能有效去除背景中的干扰纹理、异常滤镜以及水印。处理后的图像在画质和观感上,相比原图都有显著提升。” 下面的修复效果对比,直观地展示了这一进步。

尽管目前流出的仍是测试版本的信息,但足以吊起整个行业的胃口。看来,所有人都在等待它的正式登场,届时,图像生成领域的竞争格局,恐怕将迎来新的变数。

菜鸟下载发布此文仅为传递信息,不代表菜鸟下载认同其观点或证实其描述。