新手教程
AI视频
Nano Banana与Lovart AI视频制作对比测评:2025年热门新手必看一句话快速生成排行榜
摘要
Lovart平台整合NanoBananaPro、Veo3、Sora2、可灵O1等顶级AI模型,支持一句话修改视频、像素级局
年底了,AI圈又开始神仙打架了。
先有谷歌Nano Banana Pro,画图能力惊人;紧接着,国产阵营也放出大招,比如可灵刚发布的O1,号称“一句话就能改视频”。其他大厂同样摩拳擦掌,一大波新品已在路上。
神仙打架,凡人享福。
但问题也来了:工具这么多,个个都能打,到底该怎么选?
不用纠结。有一个AI“全家桶”平台,把这些顶流工具全整合在了一起:
**lovart.ai**
做图的有Nano Banana Pro、Midjourney、Flux;做视频的有Veo3.1、Sora2、可灵O1、即梦、海螺。全球排得上号的AI模型,Lovart几乎都有。想吃白糖蘸白糖,想吃红糖蘸红糖,完全不用做选择题。
打开lovart.ai,注册登录即可使用,有免费积分。界面非常干净,就是一个无限画布,左侧导航栏一个“+”号,可以在这里选择各种图像生成器。先点左边“+”新建一个项目,就能开始创作了。
下面分享几个Lovart让我印象深刻的体验。
### 视频元素可控编辑的突破
以前,大家都知道AI可以改图、生成视频,但谁能想到视频也能直接修改?用AI生成的、影视剧里扒下来的、自己拍的,都可以。只需要一句话,就能完成修改。
前几年有部美剧,设定里顶级黑客才能掌握这种技术。这才过了几年,普通人都能用了?
我抱着试一试的心态,上传了一个人物视频,再传了一张人物照片。在提示框里输入:“把视频中的女人的衣服更换为(图片)中女人衣服,其他不变。”几分钟后,修改完成。不是那种简单的替换,而是连光影、质感都一起对齐的那种。当时确实有点惊讶,技术已经进化到这个程度了。
### 从分镜到成片的高效工作流
经过反复测试,我发现一个更高效的玩法:在Lovart里先用Nano Banana Pro做图,再用Veo、Sora、可灵生成视频,能发挥最大威力。
先点左侧导航条“+”号,选“图像生成器”,选择Nano Banana Pro,输入提示词,分辨率最高可以设置到4K。比如输入一段详细的提示词,描述一个在户外草地边、阴天自然光下的东亚女性,追求胶片感和眼神戏。
图片生成后,可以直接让它生成一个“九宫格分镜”。甚至不需要想复杂的提示词,选中人物图,再上传一张参考图到Lovart,输入“参考图1九宫格人物姿势,生成图2人物的九宫格照片,与图2人物外貌衣着保持一致”,分镜图就秒出了。也可以不用参考图,直接用原始人物图加长提示词。
有了分镜图,就可以拿着去制作小短片了。在Lovart同一页面里调用Veo3、Sora2、可灵O1轮番尝试,提示词可以很简单,比如“围绕图1的分镜图片,生成一段视频,要求包含每一个镜头”。
最方便的地方就在这里——不需要纠结用哪个工具最好,只管试,哪个效果对味就用哪个。如果未来有新模型出现,Lovart也会很快集成进来。以前是用户迁就工具,现在是工具围着用户转。
### 精准可控的局部编辑
Lovart还有一些独特的功能,比如“编辑元素”。它可以精确识别原图中的人物、背景、产品、文字等所有元素,把它们分成独立图层。所有元素都可以选中、拖动、替换,甚至文字都可以直接修改内容和字体样式。
另一个功能是“Touch Edit”,点哪改哪。使用很简单,按住Ctrl键(Mac为Cmd键),点选任意图片,选中的元素会自动跳到对话窗口,然后发出指令就行。比如想让海报里的蛋挞“被咬一口”,直接在图上点一下那个蛋挞,输入“这里被咬一口”,就能实现精准的局部修改、替换或可控延展。
这个功能还能实现“融合生图”。上传多张素材图,分别点选想要的部分,最后让它们融合生成一张新图片。它做到了像素级选择,选中人物会判断是选整个人还是脸,选中笔记本会判断是选品牌标识还是整个电脑。这种交互方式,把“生图”变成了“拼想法”。
从实际体验来看,Lovart解决了“参考图怎么用”这个核心问题。AI就像一个听话的设计师,用户可以在旁边直接指点,实现像素级的精准控制。
### 内置智能体加持
使用原生AI做图时,往往需要用各种提示词去和模型“斗智斗勇”。Lovart内置了智能体,它懂设计,有上下文记忆。每次接到指令,它会先规划,再分步做图。如果生成过程中报错,它还会自动调整提示词和策略,重新生成。并且支持连续多轮修改,怎么改都不乱。
### 总结
整体来看,Lovart通过底层的智能体和Touch Edit等功能,把强大的模型组合成了高效的工作流,做到了“即见即所得”,用鼠标点一点就能完成操作。以前靠提示词的修改精度可能在80%,现在通过智能体和精准编辑功能,精度能提高到90%以上。这10%的效率提升,对于专业用户来说,确实是关键性的改善。
有了Lovart的加持,无论是Nano Banana Pro还是各种视频AI,用起来都更加得心应手。
附:九宫格提示词
**提示词①**
```markdown
你是一位电影分镜师。将一张参考图扩展为有故事性的电影镜头序列。
用户提供一张参考图。
1. 分析图中所有主体(人物/物体/环境)及其关系
2. 保持严格一致性:同一角色、服装、环境、光线贯穿所有画面
3. 不要猜测真实身份或地点,基于可见内容创作
4. 不要引入图中不存在的新元素
5. 景深随镜头变化:远景深、特写浅
生成一个 3x3 故事板网格图(如需更多镜头可用 4x3)
叙事顺序(左到右,上到下):
- 第1格:远景建立环境
- 第2格:全景展示主体全貌
- 第3格:中景切入
- 第4格:中近景聚焦
- 第5格:近景/特写
- 第6格:超近景细节
- 第7格:动态角度(仰拍或俯拍)
- 第8格:情绪/反应镜头
- 第9格:收尾镜头
要求:
- **画面中不要出现任何文字、标签、编号、标注**
- 网格仅用细黑线分隔
- 每格是一个纯净的电影画面
- 整体有清晰的情绪递进(铺垫→发展→精彩处→收尾)
- 统一的电影调色风格
```
**提示词②**
```
3×3 电影分镜 Contact Sheet 生图提示词(中文工程版)
任务目标
基于输入图片进行构图分析,锁定同一主体与同一环境,生成一个 3×3 的电影级分镜 Contact Sheet 网格,共 9 个画面,完整覆盖不同焦段与机位角度的电影镜头表达。
全局强制约束(Global Constraints)
必须是同一人物
必须是同一服装
必须是同一光照
必须是同一环境
真实摄影质感(photorealistic)
统一电影级调色(cinematic color grading)
每个画面底部必须叠加现代感、电影风格的中文字标签
字体要求:极简、专业、现代电影感字体
禁止卡通风
禁止游戏风 UI
禁止廉价字体
第一排:环境建立(Establishing)
超远景 ELS|标签:超远景
主体在极其宽广的环境中
人物比例极小,突出空间规模与整体氛围
远景 LS|标签:全身
人物从头到脚完整入镜
标准站姿或自然动态
中远景 MLS|标签:膝部构图
人物从膝盖以上入镜
兼顾环境叙事与人物表现
第二排:主体核心(Core Coverage)
中景 MS|标签:腰部以上
从腰部以上构图
强调人物姿态与互动关系
中近景 MCU|标签:胸部以上
从胸部以上构图
聚焦人物情绪、状态与表情
近景 CU|标签:面部特写
纯面部特写
突出眼神、情绪张力与心理状态
第三排:细节与角度(Details & Angles)
超近景 ECU|标签:细节特写
微距聚焦身体部位或饰品
允许:眼睛、耳朵、耳环、手指、项链
禁止:纯布料纹理、无意义物体表面
极端低角度 Low Angle|标签:低角度仰拍
从地面向上仰拍
形成强烈透视感
人物呈现高耸、压迫、英雄化视觉效果
动势感极强
高角度 High Angle|标签:高角度俯拍
从上方向下俯视主体
突出空间关系
营造弱势视角或环境压迫感
最终输出画面要求
3×3 整齐分镜网格
每一格必须满足:
正确镜头语言
对应的中文镜头标签
真实光影
电影级统一调色
人物与环境严格一致
现代专业中文字体排版
先有谷歌Nano Banana Pro,画图能力惊人;紧接着,国产阵营也放出大招,比如可灵刚发布的O1,号称“一句话就能改视频”。其他大厂同样摩拳擦掌,一大波新品已在路上。
神仙打架,凡人享福。
但问题也来了:工具这么多,个个都能打,到底该怎么选?
不用纠结。有一个AI“全家桶”平台,把这些顶流工具全整合在了一起:
**lovart.ai**
做图的有Nano Banana Pro、Midjourney、Flux;做视频的有Veo3.1、Sora2、可灵O1、即梦、海螺。全球排得上号的AI模型,Lovart几乎都有。想吃白糖蘸白糖,想吃红糖蘸红糖,完全不用做选择题。
打开lovart.ai,注册登录即可使用,有免费积分。界面非常干净,就是一个无限画布,左侧导航栏一个“+”号,可以在这里选择各种图像生成器。先点左边“+”新建一个项目,就能开始创作了。
下面分享几个Lovart让我印象深刻的体验。
### 视频元素可控编辑的突破
以前,大家都知道AI可以改图、生成视频,但谁能想到视频也能直接修改?用AI生成的、影视剧里扒下来的、自己拍的,都可以。只需要一句话,就能完成修改。
前几年有部美剧,设定里顶级黑客才能掌握这种技术。这才过了几年,普通人都能用了?
我抱着试一试的心态,上传了一个人物视频,再传了一张人物照片。在提示框里输入:“把视频中的女人的衣服更换为(图片)中女人衣服,其他不变。”几分钟后,修改完成。不是那种简单的替换,而是连光影、质感都一起对齐的那种。当时确实有点惊讶,技术已经进化到这个程度了。
### 从分镜到成片的高效工作流
经过反复测试,我发现一个更高效的玩法:在Lovart里先用Nano Banana Pro做图,再用Veo、Sora、可灵生成视频,能发挥最大威力。
先点左侧导航条“+”号,选“图像生成器”,选择Nano Banana Pro,输入提示词,分辨率最高可以设置到4K。比如输入一段详细的提示词,描述一个在户外草地边、阴天自然光下的东亚女性,追求胶片感和眼神戏。
图片生成后,可以直接让它生成一个“九宫格分镜”。甚至不需要想复杂的提示词,选中人物图,再上传一张参考图到Lovart,输入“参考图1九宫格人物姿势,生成图2人物的九宫格照片,与图2人物外貌衣着保持一致”,分镜图就秒出了。也可以不用参考图,直接用原始人物图加长提示词。
有了分镜图,就可以拿着去制作小短片了。在Lovart同一页面里调用Veo3、Sora2、可灵O1轮番尝试,提示词可以很简单,比如“围绕图1的分镜图片,生成一段视频,要求包含每一个镜头”。
最方便的地方就在这里——不需要纠结用哪个工具最好,只管试,哪个效果对味就用哪个。如果未来有新模型出现,Lovart也会很快集成进来。以前是用户迁就工具,现在是工具围着用户转。
### 精准可控的局部编辑
Lovart还有一些独特的功能,比如“编辑元素”。它可以精确识别原图中的人物、背景、产品、文字等所有元素,把它们分成独立图层。所有元素都可以选中、拖动、替换,甚至文字都可以直接修改内容和字体样式。
另一个功能是“Touch Edit”,点哪改哪。使用很简单,按住Ctrl键(Mac为Cmd键),点选任意图片,选中的元素会自动跳到对话窗口,然后发出指令就行。比如想让海报里的蛋挞“被咬一口”,直接在图上点一下那个蛋挞,输入“这里被咬一口”,就能实现精准的局部修改、替换或可控延展。
这个功能还能实现“融合生图”。上传多张素材图,分别点选想要的部分,最后让它们融合生成一张新图片。它做到了像素级选择,选中人物会判断是选整个人还是脸,选中笔记本会判断是选品牌标识还是整个电脑。这种交互方式,把“生图”变成了“拼想法”。
从实际体验来看,Lovart解决了“参考图怎么用”这个核心问题。AI就像一个听话的设计师,用户可以在旁边直接指点,实现像素级的精准控制。
### 内置智能体加持
使用原生AI做图时,往往需要用各种提示词去和模型“斗智斗勇”。Lovart内置了智能体,它懂设计,有上下文记忆。每次接到指令,它会先规划,再分步做图。如果生成过程中报错,它还会自动调整提示词和策略,重新生成。并且支持连续多轮修改,怎么改都不乱。
### 总结
整体来看,Lovart通过底层的智能体和Touch Edit等功能,把强大的模型组合成了高效的工作流,做到了“即见即所得”,用鼠标点一点就能完成操作。以前靠提示词的修改精度可能在80%,现在通过智能体和精准编辑功能,精度能提高到90%以上。这10%的效率提升,对于专业用户来说,确实是关键性的改善。
有了Lovart的加持,无论是Nano Banana Pro还是各种视频AI,用起来都更加得心应手。
附:九宫格提示词
**提示词①**
```markdown
来源:互联网
免责声明
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。