菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > Stable Audio 3深度测评:秒级生成长音频的创作利器与竞品对比
产业资讯 3深度

Stable Audio 3深度测评:秒级生成长音频的创作利器与竞品对比

2026-05-27
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

StabilityAI发布新一代音频大模型StableAudio3,并开源部分权重。该模型支持高品质立体声输出

Stability AI正式开源其新一代音频生成模型Stable Audio 3,标志着专业级音频合成技术进入新阶段。这款基于潜扩散架构的模型专为高品质立体声音频生成与编辑优化,在输出质量与生成速度上均实现了关键性突破。

新模型家族提供从轻量到重量级的多种规格,精准覆盖从音乐创作到专业音效设计的多元化需求。其核心能力在于支持可变长度音频生成,并创新性地集成了基于内补成像技术的音频编辑功能,为专业创作者提供了前所未有的工作流灵活性。

image.png

即时渲染:效率的范式转变

本次升级的核心在于计算效率的彻底重构。通过variable-length技术,模型能够动态分配算力资源,精准匹配目标音频时长,从根本上消除了固定长度模型固有的算力浪费。在高性能硬件实测中,效率优势极为显著:生成20秒音频仅需约0.62秒,渲染长达380秒的完整音乐片段也仅耗时1.31秒左右。

这一速度飞跃源于创新的三阶段训练流程。该流程使Stable Audio 3在推理时无需依赖传统的无分类器指导技术,仅通过单步前向传播即可完成生成,实现了近乎即时的用户体验。目前,社区开发者已可通过Hugging Face获取小型与中型模型权重,而性能更强大的大型版本将通过商业授权提供。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多