新手教程 AI视频

AI视频制作教程：详细教你学会用AI创作视频

2026-06-07

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

爆肝1个月后，我梳理出一套系统化的AI视频创作工作流。这背后，是数十次工作流重构和工

爆肝1个月后，我梳理出一套系统化的AI视频创作工作流。

ai视频怎么做？全网最详细的AI视频创作教程，教你学会用ai制作视频

这背后，是数十次工作流重构和工具组合测试的反复打磨。如今，终于能把这套流程写成一篇可复用的教程。

本文深度拆解AI视频创作工作流的7大步骤——从脚本生成、图像制作到视频合成的全链条实操，涉及文本、图像、视频三大AI领域工具的协同配合。干货很干，也很肝。

下面就来逐一拆解。

步骤一：AI生成创意脚本

文本生成类的AIGC工具有不少选择，比如Deepseek、ChatGPT、Claude、Grok等。

在计划创作这条视频时，市面上讨论热度最高的AI大模型是老马发布的Grok 3——他称之为“地球上最聪明的人工智能”。所以，这条视频的创意脚本就选用了Grok 3。

作为地球上“最聪明”的AI，它不需要多么复杂的提示词。你只需要描述清楚需求以及它的任务。

需求：我要做一条AI创意短片，内容是xxx

任务：帮我写下创意脚本，9个分镜。

完整的提示词就是：“我需要做一条AI创意短片，内容是‘小米Su7 Ultra、薯队长（小红书IP吉祥物）、冬季场景、春季场景、上海东方明珠塔’，我需要你为我写下这条短片的创意脚本，大概9个分镜。”

多说一句：理论上，需求描述得越详细，AI回复的就越精准。但创意这件事，谁一开始就有非常明确的需求呢？不如先定个大方向，让AI自行发挥，再通过多轮对话逐步迭代。这就好比，你与AI一起激烈讨论这条创意视频方案，而不是直接让它出方案。讨论时，可以把AI想象成你的同事、领导或老师。

步骤二：AI生成图像提示词

AI大模型能生成创意脚本，自然也能生成Prompt。相比之下，根据分镜描述或图片内容反推Prompt，比处理复杂的创意脚本任务更简单。

推荐用Kimi来生成提示词。没别的原因，使用顺手，回复速度快。

比如，使用Grok的DeepSearch功能，它往往一顿输出，而用户其实只需要中英文提示词。Kimi就简单、纯粹很多。

生成图像提示词的操作流程与第一步类似：说清楚你的需求，它需要为你做什么。

第一步已经生成了视频脚本，那么将脚本内容发送给Kimi：“我需要用AIGC工具创作一个短片。接下来我会发送脚本内容。请根据我发送的信息，帮我生成StableDiffusion所需的Prompt。注意：生成英文提示词后，再给一份中文翻译，方便我查看。分镜一：冬季雪山驾驶。内容：航拍视角，黄色小米SU7 Ultra在雪山蜿蜒道路上行驶，周围白雪皑皑。”

步骤三：AI生成分镜图像

生成图像的AIGC工具有很多，比如Midjourney、StableDiffusion、即梦AI等。但如果需要控制图像中的主体，StableDiffusion是唯一选择。

1、前期构思

先思考这条创意短片的主体是什么——小米SU7 Ultra和小红书吉祥物（薯队长）。

如果将小米SU7 Ultra的分镜提示词发给Midjourney，它会生成什么效果？结果往往只有颜色像，外观细节都不是小米SU7 Ultra。原因是Midjourney模型数据里没有小米SU7 Ultra的图像数据，自然也无法生成。

那StableDiffusion的原生模型（如Flux、SDXL、SD2.1等）能生成吗？也不能。因为原生模型同样缺少这些数据。

结果已经十分确定：模型缺少小米SU7 Ultra的图像数据。而能解决这个问题的，是StableDiffusion开源生态中的一项技术——Lora模型。

LoRA（Low-Rank Adaptation）是一种轻量化微调技术，通过对大模型进行低秩矩阵分解，仅训练少量参数即可实现特定任务或风格的适配。在AI绘画领域，它可作为大模型的“补丁”，用于强化特定人物特征、艺术风格或细节，文件通常只有几十到几百MB。用户只需将LoRA模型与大模型结合使用，即可快速生成定制化图像。

步骤四：AI图像修复

AI直出的图像，绝大部分情况下需要后期修复才能使用（尤其在商业场景）。修图工具推荐Photoshop和Midjourney结合使用。

修图方法一：简单场景

比如分镜描述“小米SU7 Ultra在城市道路上行驶，城市建筑墙上有一张巨大的海报”。AI能生成不错的场景，但海报内容却无法精准控制。这时用Photoshop修图就是最佳选择。

修图方法二：复杂场景

思考一下：这张图如何实现？

拆解步骤：最开始想用StableDiffusion直接生成，把画面描述丢给Kimi写提示词。但无论如何调整提示词，生图效果始终达不到预期。问题在于：飞机底下挂一张巨大的海报，并且出现在有小米SU7 Ultra的场景中，背景是上海东方明珠塔附近……想要的画面元素太多，AI难以把握重点，导致画面错乱。

步骤五：AI生成分镜视频

目前市面上较好的AI视频模型有可灵AI、即梦AI、海螺AI、Vidu等。但在视频生成的稳定性上，可灵AI表现更强。所以本片子的视频生成部分，交给可灵AI来完成。

这个步骤也拆解两个场景：单镜头生成和双镜头（首尾帧）生成。

1、单镜头生成

操作步骤：图生视频——选择可灵1.6模型——输入提示词——点击生成。

视频生成的重点在提示词描述。做这条视频时，是通过Grok来写AI视频提示词的。不久前，可灵上线了DeepSeek提示词助手，可以在其中描述想要表现的画面，例如“一架飞机拖着一张巨大的海报飞向镜头，镜头画面最终被海报填满”，它就能生成相应提示词。

步骤六：视频后期合成

到这一步，基本完成短片80%的工作。如果用AE等动效工具做片、转场等效果，可能还需花点时间。本条视频轻度使用AE，过程不展开，放张图意思一下。

这个步骤主要说剪映的AI功能。

通常，AI视频生成工具生成的画质不会太高（通常是1080P）。如果想生成超清画质，消耗的点数较多，或者——贵。而AI的随机性也意味着难以一次完成任务。所以生成视频时，建议先用小分辨率的生成品质刷视频，比如可灵的标准模式。

最终产出的视频一定要保证画质清晰，否则花大量时间，最后出稿时因为画质问题让视频显得不高级，非常可惜。市面上有不少视频修复、放大工具，但这里只推荐剪映内置功能，方便好用。剪辑完成后，请把“超清画质、视频降噪、AI补帧”都用上（不过这些需要会员才能用）。

最后，导出视频时将分辨率设为4K，补分辨率勾选上，就能得到超高清的片子。

步骤七：AI生成封面标题

最后一步：视频做好后需要一张封面，上面通常有标题文字信息。

封面好解决——用这条片子中的某张图片分镜，或按照生成分镜图像的步骤出图即可。

标题文字可以使用即梦AI来做。即梦的2.1版本模型可以生成中文字体。创作前，依旧用AI来写提示词。即梦AI最近也上线了DeepSeek模型，可以直接发送需求：“我需要设计标题文字，内容是【春日秀场薯样年华】，白字黑底。”

输出的提示词：为“春日秀场薯样年华”设计标题文字，采用粗体、艺术化、手绘字体，呈现动态现代感。文字为纯黑色，背景为纯白色，居中排列，呈单行略带曲线的布局，增强视觉流动感。

最后，挑选一张认可的标题设计，用Photoshop等排版工具完成。

放上这条视频的10张分镜图，供参考。

创作一条高质量、有创意的AI视频，投入的成本不会很低。在分镜创作上，可能需要花大量时间去尝试。虽然AI的生产能力强，但真正能落地使用的内容有限——AI的随机性意味着需要不断调试参数、刷内容，只能尽量控制AI生成的结果。

在AI工具的使用成本上，顶级大模型如图像模型（Flux）、视频模型（可灵、Vidu等），基本需要开通会员才能顺畅使用；Photoshop、剪映等设计工具的AI功能也需要付费。但对比传统视频工作流，这些成本并不算高。

在AI时代，每个人都有可能成为导演。以前遥不可及的梦，或许AI真的能帮我们实现。

来源：互联网

上一篇 2024年最新AI办公软件排行榜：四十二款精选办公必备工具盘点推荐 下一篇 AI生成非遗视频：1分钟糖画衍纸刺绣剪纸教程

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。