其他资讯
人工智能
JoyAI-Echo深度评测:京东开源长音视频生成框架
摘要
京东开源JoyAI-Echo长音视频生成框架,通过内置DirectorAgent和记忆库,在多镜头切换时保持人
京东在AI视频生成领域投下一枚重磅炸弹——正式开源了JoyAI-Echo长音视频生成框架。这套系统的核心能力在于:机器不仅能产出连续视频,还能在多镜头切换时精准锁定角色的面部特征与音色。以往这是行业公认的痛点——大多数模型换个机位,角色长相和声音便双双走样。JoyAI-Echo的解法是内置一个智能“导演助理”Director Agent,搭配专属记忆库。这个记忆库在多镜头生成过程中持续追踪并复用角色的外观属性与说话人声纹信息。简言之,导演助理负责分镜调度,记忆库负责“记住”演员的长相和嗓音。如此一来,即便镜头不断切换,人物形象依然稳定如一。
更值得关注的是,京东将JoyAI-Echo的代码与权重全部开源。开发者可直接下载、部署、二次开发,免去从零搭建的重复劳动。这对整个开源社区而言,是一次实质性赋能。从技术演进角度看,长视频生成一直是AIGC最难啃的骨头,JoyAI-Echo在角色一致性上做出的突破,值得深度跟进。

来源:互联网
免责声明
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。