菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > Ideogram 4.0 开源测评:93亿参数文字生成AI性能登顶全球第四
产业资讯 开源

Ideogram 4.0 开源测评:93亿参数文字生成AI性能登顶全球第四

2026-06-07
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

6月3日,AI图像生成平台Ideogram正式发布了开放权重文生图模型Ideogram 4 0。根据官方公布的基

6月3日,AI图像生成平台Ideogram正式发布了开放权重文生图模型Ideogram 4.0。根据官方公布的基准测试结果,该模型已经成为当前性能领先的开源图像生成模型之一,尤其在文字生成与版式控制能力上有了质的飞跃——这一点,过去一直是开源模型的软肋。

Ideogram 4.0的核心规模达到93亿参数(9.3B),采用了近年来主流开源模型普遍使用的单流(Single-Stream)架构设计。简单来说,文本Token与图像Token在统一的自注意力序列中进行联合建模,从而大幅提升文本与视觉内容之间的协同生成能力。与此同时,模型将“设计可控性”作为核心目标,在训练和推理阶段都强化了对布局、排版和视觉元素的控制。

QQ20260605-101427.jpg

为了增强版式控制能力,Ideogram在训练过程中引入了对象与文本的边界框(Bounding Box)数据,让模型能够理解图像元素之间的空间关系。同时还结合结构化JSON字幕数据进行训练,用户现在可以通过提示词更精准地控制对象位置、文本布局以及整体排版结构——这已经非常接近专业设计工具的创作体验了。

在第三方评测方面,DesignArena最新榜单显示,Ideogram 4.0已经超越了Nano Banana Pro,位列全球第四。DesignArena的评测方式是隐藏模型身份后由人工评审对生成结果进行盲测打分,因此能够较好地反映真实用户对图像质量和视觉表现力的主观评价。换句话说,这台模型不仅跑分能打,实际用户体验也得到了认可。

随着开源图像生成模型竞争持续升温,Ideogram 4.0凭借领先的文字生成能力和设计可控性,正在成为海报制作、品牌营销和视觉内容创作领域一个值得关注的新选择。如果你也想上手试试,模型已经开源,地址在这里:https://github.com/ideogram-oss/ideogram4

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多