菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI教程 > AI视频制作教程:详细教你学会用AI创作视频
新手教程 AI视频

AI视频制作教程:详细教你学会用AI创作视频

2026-06-07
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

爆肝1个月后,我梳理出一套系统化的AI视频创作工作流。这背后,是数十次工作流重构和工

爆肝1个月后,我梳理出一套系统化的AI视频创作工作流。

ai视频怎么做?全网最详细的AI视频创作教程,教你学会用ai制作视频

这背后,是数十次工作流重构和工具组合测试的反复打磨。如今,终于能把这套流程写成一篇可复用的教程。

本文深度拆解AI视频创作工作流的7大步骤——从脚本生成、图像制作到视频合成的全链条实操,涉及文本、图像、视频三大AI领域工具的协同配合。干货很干,也很肝。

下面就来逐一拆解。

步骤一:AI生成创意脚本

文本生成类的AIGC工具有不少选择,比如Deepseek、ChatGPT、Claude、Grok等。

在计划创作这条视频时,市面上讨论热度最高的AI大模型是老马发布的Grok 3——他称之为“地球上最聪明的人工智能”。所以,这条视频的创意脚本就选用了Grok 3。

作为地球上“最聪明”的AI,它不需要多么复杂的提示词。你只需要描述清楚需求以及它的任务。

需求:我要做一条AI创意短片,内容是xxx

任务:帮我写下创意脚本,9个分镜。

完整的提示词就是:“我需要做一条AI创意短片,内容是‘小米Su7 Ultra、薯队长(小红书IP吉祥物)、冬季场景、春季场景、上海东方明珠塔’,我需要你为我写下这条短片的创意脚本,大概9个分镜。”

多说一句:理论上,需求描述得越详细,AI回复的就越精准。但创意这件事,谁一开始就有非常明确的需求呢?不如先定个大方向,让AI自行发挥,再通过多轮对话逐步迭代。这就好比,你与AI一起激烈讨论这条创意视频方案,而不是直接让它出方案。讨论时,可以把AI想象成你的同事、领导或老师。

步骤二:AI生成图像提示词

AI大模型能生成创意脚本,自然也能生成Prompt。相比之下,根据分镜描述或图片内容反推Prompt,比处理复杂的创意脚本任务更简单。

推荐用Kimi来生成提示词。没别的原因,使用顺手,回复速度快。

比如,使用Grok的DeepSearch功能,它往往一顿输出,而用户其实只需要中英文提示词。Kimi就简单、纯粹很多。

生成图像提示词的操作流程与第一步类似:说清楚你的需求,它需要为你做什么。

第一步已经生成了视频脚本,那么将脚本内容发送给Kimi:“我需要用AIGC工具创作一个短片。接下来我会发送脚本内容。请根据我发送的信息,帮我生成StableDiffusion所需的Prompt。注意:生成英文提示词后,再给一份中文翻译,方便我查看。分镜一:冬季雪山驾驶。内容:航拍视角,黄色小米SU7 Ultra在雪山蜿蜒道路上行驶,周围白雪皑皑。”

步骤三:AI生成分镜图像

生成图像的AIGC工具有很多,比如Midjourney、StableDiffusion、即梦AI等。但如果需要控制图像中的主体,StableDiffusion是唯一选择。

1、前期构思

先思考这条创意短片的主体是什么——小米SU7 Ultra和小红书吉祥物(薯队长)。

如果将小米SU7 Ultra的分镜提示词发给Midjourney,它会生成什么效果?结果往往只有颜色像,外观细节都不是小米SU7 Ultra。原因是Midjourney模型数据里没有小米SU7 Ultra的图像数据,自然也无法生成。

那StableDiffusion的原生模型(如Flux、SDXL、SD2.1等)能生成吗?也不能。因为原生模型同样缺少这些数据。

结果已经十分确定:模型缺少小米SU7 Ultra的图像数据。而能解决这个问题的,是StableDiffusion开源生态中的一项技术——Lora模型。

LoRA(Low-Rank Adaptation)是一种轻量化微调技术,通过对大模型进行低秩矩阵分解,仅训练少量参数即可实现特定任务或风格的适配。在AI绘画领域,它可作为大模型的“补丁”,用于强化特定人物特征、艺术风格或细节,文件通常只有几十到几百MB。用户只需将LoRA模型与大模型结合使用,即可快速生成定制化图像。

步骤四:AI图像修复

AI直出的图像,绝大部分情况下需要后期修复才能使用(尤其在商业场景)。修图工具推荐Photoshop和Midjourney结合使用。

修图方法一:简单场景

比如分镜描述“小米SU7 Ultra在城市道路上行驶,城市建筑墙上有一张巨大的海报”。AI能生成不错的场景,但海报内容却无法精准控制。这时用Photoshop修图就是最佳选择。

修图方法二:复杂场景

思考一下:这张图如何实现?

拆解步骤:最开始想用StableDiffusion直接生成,把画面描述丢给Kimi写提示词。但无论如何调整提示词,生图效果始终达不到预期。问题在于:飞机底下挂一张巨大的海报,并且出现在有小米SU7 Ultra的场景中,背景是上海东方明珠塔附近……想要的画面元素太多,AI难以把握重点,导致画面错乱。

步骤五:AI生成分镜视频

目前市面上较好的AI视频模型有可灵AI、即梦AI、海螺AI、Vidu等。但在视频生成的稳定性上,可灵AI表现更强。所以本片子的视频生成部分,交给可灵AI来完成。

这个步骤也拆解两个场景:单镜头生成和双镜头(首尾帧)生成。

1、单镜头生成

操作步骤:图生视频——选择可灵1.6模型——输入提示词——点击生成。

视频生成的重点在提示词描述。做这条视频时,是通过Grok来写AI视频提示词的。不久前,可灵上线了DeepSeek提示词助手,可以在其中描述想要表现的画面,例如“一架飞机拖着一张巨大的海报飞向镜头,镜头画面最终被海报填满”,它就能生成相应提示词。

步骤六:视频后期合成

到这一步,基本完成短片80%的工作。如果用AE等动效工具做片、转场等效果,可能还需花点时间。本条视频轻度使用AE,过程不展开,放张图意思一下。

这个步骤主要说剪映的AI功能。

通常,AI视频生成工具生成的画质不会太高(通常是1080P)。如果想生成超清画质,消耗的点数较多,或者——贵。而AI的随机性也意味着难以一次完成任务。所以生成视频时,建议先用小分辨率的生成品质刷视频,比如可灵的标准模式。

最终产出的视频一定要保证画质清晰,否则花大量时间,最后出稿时因为画质问题让视频显得不高级,非常可惜。市面上有不少视频修复、放大工具,但这里只推荐剪映内置功能,方便好用。剪辑完成后,请把“超清画质、视频降噪、AI补帧”都用上(不过这些需要会员才能用)。

最后,导出视频时将分辨率设为4K,补分辨率勾选上,就能得到超高清的片子。

步骤七:AI生成封面标题

最后一步:视频做好后需要一张封面,上面通常有标题文字信息。

封面好解决——用这条片子中的某张图片分镜,或按照生成分镜图像的步骤出图即可。

标题文字可以使用即梦AI来做。即梦的2.1版本模型可以生成中文字体。创作前,依旧用AI来写提示词。即梦AI最近也上线了DeepSeek模型,可以直接发送需求:“我需要设计标题文字,内容是【春日秀场 薯样年华】,白字黑底。”

输出的提示词:为“春日秀场 薯样年华”设计标题文字,采用粗体、艺术化、手绘字体,呈现动态现代感。文字为纯黑色,背景为纯白色,居中排列,呈单行略带曲线的布局,增强视觉流动感。

最后,挑选一张认可的标题设计,用Photoshop等排版工具完成。

放上这条视频的10张分镜图,供参考。

创作一条高质量、有创意的AI视频,投入的成本不会很低。在分镜创作上,可能需要花大量时间去尝试。虽然AI的生产能力强,但真正能落地使用的内容有限——AI的随机性意味着需要不断调试参数、刷内容,只能尽量控制AI生成的结果。

在AI工具的使用成本上,顶级大模型如图像模型(Flux)、视频模型(可灵、Vidu等),基本需要开通会员才能顺畅使用;Photoshop、剪映等设计工具的AI功能也需要付费。但对比传统视频工作流,这些成本并不算高。

在AI时代,每个人都有可能成为导演。以前遥不可及的梦,或许AI真的能帮我们实现。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多