菜鸟AI - 让提示词生成更简单！

首页热搜排行话题热点标签提示词教程工具最新

菜鸟AI www.cn486.com

AI工具安装新手教程进阶教程辅助资源 AI提示词热点资讯技术资讯产业资讯内容生成模型技术 AI信息库

登录注册

邮箱

密码

记住密码

忘记密码？

还没有账号？使用邮箱注册

登录注册

邮箱

验证码

获取验证码

密码

当前为极简注册模式，只需账号和密码即可创建账号。

已有账号？登录

重置密码

忘记密码了？请在下方输入您的邮箱地址，我们将发送验证码帮助您重置密码。

邮箱

验证码

获取验证码

密码

确认密码

已有账号？登录

首页 > AI资讯新闻 > Stable Audio 3深度测评：秒级生成长音频的创作利器与竞品对比

产业资讯 3深度

Stable Audio 3深度测评：秒级生成长音频的创作利器与竞品对比

2026-05-27

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

StabilityAI发布新一代音频大模型StableAudio3，并开源部分权重。该模型支持高品质立体声输出

Stability AI正式开源其新一代音频生成模型Stable Audio 3，标志着专业级音频合成技术进入新阶段。这款基于潜扩散架构的模型专为高品质立体声音频生成与编辑优化，在输出质量与生成速度上均实现了关键性突破。

新模型家族提供从轻量到重量级的多种规格，精准覆盖从音乐创作到专业音效设计的多元化需求。其核心能力在于支持可变长度音频生成，并创新性地集成了基于内补成像技术的音频编辑功能，为专业创作者提供了前所未有的工作流灵活性。

即时渲染：效率的范式转变

本次升级的核心在于计算效率的彻底重构。通过variable-length技术，模型能够动态分配算力资源，精准匹配目标音频时长，从根本上消除了固定长度模型固有的算力浪费。在高性能硬件实测中，效率优势极为显著：生成20秒音频仅需约0.62秒，渲染长达380秒的完整音乐片段也仅耗时1.31秒左右。

这一速度飞跃源于创新的三阶段训练流程。该流程使Stable Audio 3在推理时无需依赖传统的无分类器指导技术，仅通过单步前向传播即可完成生成，实现了近乎即时的用户体验。目前，社区开发者已可通过Hugging Face获取小型与中型模型权重，而性能更强大的大型版本将通过商业授权提供。

来源：互联网

上一篇 Uber总裁质疑AI投入：Token成本暴涨为何未带来实质回报？ 下一篇 DeepSeek论文撰写实战：AI协作研究新范式深度解析

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多

Hermes Desktop 桌面AI智能体实测：值得入手吗？

HermesDesktop是NousResearch推出的AI桌面客户端，支持长期...

比亚迪进军人形机器人代号“尧舜禹”首曝

比亚迪2022年秘密立项人形机器人项目“尧舜禹”，已研发四...

晶圆级AI算力突破：内存墙解决方案排行榜

2026年AI推理资本支出首超训练，算力瓶颈转向内存带宽与通...

2024年AI音乐创作排行榜：40秒生成神曲月入十几万

杭州一位创作者利用AI音乐生成工具，在单月内实现超十万元...

规划评测框架开源年度精选：腾讯与人大高瓴联合权威榜单

腾讯混元团队与人大高瓴人工智能学院联合开源了一款新框架...

AI破解80年数学难题，数学家为何惊慌？

数学家，陷入焦虑。这事颇具深意。上个月，OpenAI内部模...

腾讯文档人机双写实测：WorkBuddy接入AI原生编辑器

腾讯文档发布行业首创的「人机双写」能力，全产品线升级。...

Anthropic警告AI自我复制时代逼近全球研发需刹车

在AI能力以指数级加速突破之际，Anthropic却选择主动踩下刹...

AI三巨头联合呼吁DNA检测：一场真相调查

67位AI与生物科技领域大佬罕见联名，呼吁美国国会立法强制...

93亿开源模型吊打800亿，Midjourney短板终结评测

93亿参数的开源模型Ideogram4 0采用单流DiT架构与Qwen3-VL...