豆包Seaweed视频模型实测:能否击败Sora?
摘要
字节跳动推出SeaweedAI视频模型,作为PixelDance轻量版,保留核心能力且成本更低、速度更快
前天,AI视频圈迎来重磅更新——字节跳动正式发布两款全新AI视频模型:PixelDance与Seaweed。不少人将其称作“AI视频的iPhone时刻”,从已曝光的素材来看,这个评价并不夸张。
PixelDance的核心优势非常清晰:支持人物复杂连续动作、多镜头组合、以及精细运镜控制。仅凭官方放出的几个案例,就足以让人眼前一亮。但问题在于,目前PixelDance的测试资格极其稀缺,甚至比GPT语音模式的内测名额还难获取。幸运的是,我们拿到了Seaweed模型的内测权限。
很多人可能会问,PixelDance和Seaweed之间到底是什么关系?简单来说,两者采用不同的模型架构,定位也截然不同。一个合理的推断是:Seaweed更像是PixelDance的“轻量版”——保留了部分核心能力,但成本更低、生成速度更快。本次评测,我们以PixelDance的新能力作为主要参考基准,同时结合AI视频工具的常见痛点,全面检验Seaweed的真实表现。
一、人物复杂连续动作
根据官方信息,PixelDance能在10秒内完成3个连续动作。而当前主流AI视频工具,单次生成通常只能输出一个动作,像眨眼、挥手、摇头这类小幅运动已是极限。大幅动作往往导致画面崩坏。为了呈现连续动作,创作者不得不把分镜拆得更细,最后靠剪辑来拼接流畅感。
我们用相似的画面对比PixelDance(上)和Seaweed(下)的效果。

受限于5秒的生成时长,Seaweed在精准还原【摘下墨镜】后【向前走】的连续动作上确实力不从心。不过,人物动作的自然度以及眼睛细节的补足,表现相当出色。
二、多镜头组合
多镜头组合,简单来说就是单次生成的视频中包含不同角度的镜头切换。可能是大远景后切到人物脸部特写,也可能是人物不同正侧面的转换。说起来简单,但在以往的AI工具中,除了Sora的官方案例外,很少见到类似效果。
我们用Seaweed复刻了一个与PixelDance官方案例相似的画面。

从实际效果看,PixelDance的镜头切换确实是顶级水准。而Seaweed虽然动作流畅度和幅度都够,但遗憾的是我们抽了多次卡,都没能实现镜头切换的效果。
PixelDance这两大核心功能,本质上在做同一件事:延长生成视频的“有效时长”。这里的“有效时长”不是把5秒延长到10秒、20秒甚至40秒,而是在有限时长内塞进尽可能多的变化,同时保持画面一致性。
三、运镜控制
AI视频里的运镜到底有多少种?Runway官方指南列出了15种Camera Movement,配合4种镜头运动速度,可以组合出60种运镜控制。听起来不少,但拿着这个清单去请教影视行业的朋友,得到的回复是:这只是影视制作中的一小部分。
在以往使用中,想让模型听话地做出指定运镜,确实要靠一点运气。但这次PixelDance给出的案例,确实让人眼前一亮:通过prompt精准控制镜头运动轨迹,从【360度环绕】到【侧脸】再到【正脸】,最后定格在人物面部特写。
Seaweed虽然也实现了【360度】环绕运动,但缺少镜头远近的变化,也没有精确落点到人物面部特写。看来Seaweed还没学到PixelDance的全部真本事。
不过,回到同一起跑线来看,Seaweed是否解决了目前AI视频工具中的某些痛点?这次我们直接上强度了——毕竟基础画面效果Seaweed已经挑不出什么大毛病。我们给它出了几道“奥数题”:文字稳定不崩、多人场景不崩、超远景小人不崩、画面元素无中生有、生成风格稳定、多人物互动。
四、文字稳定不崩
第一个测试结果就让人非常惊喜。Seaweed做到了画面中的文字稳定存在,不会消失,也不会和画面融合成一体。以后谁还需要花钱做动态海报?

五、多人场景不崩
接下来直接上王炸测试。多人场景有多难实现,懂的人都懂。这么多张脸要做到完全不崩,以前可能要抽卡几十上百次都不一定成功。但Seaweed给出的效果,人脸绝对稳定。而且抽卡次数在10次以内就能得到满意结果,还能让你精挑细选自己喜欢的动态。绝,真的绝。

六、超远景小人不崩
以前的大远景镜头,我们根本不奢求人物的身影能有什么好的动态,只求不要融成一坨。现在终于不用愁了。除了人物稳定,甚至还能实现多主体、场景多方面的稳定动态效果。

七、画面元素无中生有
以前想要实现画面中没有的元素出现,用得最多的就是首尾帧。现在又多了一种方式:直接通过prompt,让Seaweed帮你实现【小男孩出现在画面中】【一只手出现在画面中】的特定效果。不过稍微有点不稳定,这种无中生有的效果还是需要多抽几次卡。

八、生成风格稳定
相信很多人在生成视频时都遇到过一种情况:模型会把画面中的主体“嗖”一下变成一个奇怪的3D人偶,而且这种情况还不少见。这次即梦的更新,最让人惊喜的就是风格的延续非常稳定。终于不再有鬼畜3D了,做梦都会笑醒的程度。

(这只小松鼠好可爱!)
九、多人物互动
多人物互动的难度就不多说了,每一次测试都带着期待,每一次都有些微失望。但这次测试的两个case,至少让人看到了希望。打拳有拳拳到肉的感觉,跳舞时人物的表情和灯光都很对味儿。就是速度上还差点意思。

整体测下来,虽然还没用上PixelDance,但对Seaweed已经非常满意了。至少在当前的工具层面,即梦算是打开了一个新维度。单是【风格稳定】和【文字不崩】这两个点,就足够给一个优秀分了。
写在最后
值得一提的是,这次测试的全流程都是在即梦网页端完成的。生图、修图、高清、音乐、视频生成,全部一站式完成。真的很爽,不需要在各种界面跳来跳去。而且支持手机端,现在外出遇到灵感,都可以用即梦刷两张图。唯一遗憾的是,恨自己手不够多,把灵感变成影片的周期还是有点慢。
字节跳动,抓紧时间多买几顿显卡,把PixelDance上线到即梦吧。我已经准备好了脚本,就等着制作一部由PixelDance为主力工具的AI短剧了。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。