新手教程即梦AI数字人

即梦AI数字人教程：一张照片轻松生成唱歌视频

2026-06-05

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

即梦AI数字人1 5版本新增动作模仿功能，支持精细控制情绪、走位和运镜，能生成高质量的

即梦平台的「数字人1.5」版本已完成全量推送，全面开放使用。

即梦AI怎么制作出自己的数字人？用一张照片轻松制作数字人唱歌视频

核心升级：数字人1.5新增角色动作模仿能力。相较此前仅支持角色创建，新版能让数字人根据音频内容自动生成匹配的画面动作。

借助动作描述指令，用户可精准调控角色的情绪、肢体动作、走位路线及镜头运动。简言之，数字人1.5从单纯的配音工具升级为可生成完整视频的创作引擎。

生成的视频画面不仅支持角色演唱，还能根据动作提示调整景别切换、角色行走路径，手势表达也更富变化。

可以预见，数字人1.5将在AI音乐制作、影视动画内容、二次创作视频等领域催生大量创新应用。

接下来，通过一个实际制作的AI MV案例，完整拆解核心操作流程。

组图生成环节

第一步，推荐组合使用当前热门的「图片4.0模型」，上传一张参考图，系统即可自动扩展生成一组连贯的场景图。

例如，基于此前生成的MV主图进行场景延伸——展示一位在录音棚内录歌的女歌手。

使用图片4.0模型生成分镜头画面：

❝提示词：一位女歌手在录音棚中完整演唱歌曲并完成专辑录制，场景氛围深情动人，预设镜头切换次数为10次。

操作流程简洁：上传参考图，输入上述指令，点击发送即可完成。

值得注意的是，即梦4已全面支持4K超清图片输出。

生成完毕后，将各分镜图片逐一保存至本地备用。

数字人创建流程

登录即梦官网，在生成页面下拉找到「数字人」模块，展开后即可看到新上线的「动作描述」功能。

关键操作步骤：

1. 在左侧区域上传角色图片。

2. 上传音频：提供两种模式——可选择预设音色并输入文字脚本，也可直接上传本地音乐文件。

上传音频的界面示意：

音色选择与文字输入的界面示意：

3. 动作描述：输入图像生成视频的提示词，通常包含景别、镜头运动说明、角色动作指令。

4. 模式选择：数字人1.5提供大师、快速、基础三种模式，其中大师模式积分消耗最高。

指定说话角色：若上传图片包含多个角色，可在「角色说」区域点击切换当前需要配音的角色。

注：关于生成超过15秒的数字人视频，可行方案是：使用即梦4图片模型生成8张分镜图，将长音乐拆分为多段分别处理。需注意，由于图片由即梦4.0直接生成，最终拼接时个别分镜可能出现人脸不一致的问题——这是需要提前规避的常见坑点。

大师模式下的人物面部表情更为生动自然，成片质量最优，但相应积分消耗也最高。

图生视频提示词编写

视频创作中最常见的问题是如何撰写图生视频提示词。这需要用户对镜头语言、角色动作、场景转场具备一定理解。

以下提供一套简洁的图生视频提示词模板，可直接在豆包AI中调用：

❝以所给图片作为首镜头，生成一个5秒的视频分镜脚本，并输出动效提示词。提示词结构需包含：景别、视角、镜头运动、画面内容、人物表情，总字数控制在200字以内。最后将分镜提示词整合为一段连贯描述。

该模板可帮助快速产出基础视频，但若要提升最终呈现效果，仍需注入创意构思。

歌词与音乐生成

歌词与音乐环节，建议使用DeepSeek生成歌词，随后在AI音乐平台谱曲。

启动DeepSeek推理模型，将以下需求提交给AI：

❝请创作一首情歌，风格参考《错位时空》，主题聚焦于男女主角深刻的暗恋情感，要求深情且富有感染力，符合年轻人的审美偏好。

经过推理生成，获得如下完整歌词：

❝《追寻你的温柔》咖啡馆里灯光下的倒影，是我对着咖啡杯底心事的沉积，杯口一圈一圈是你的指纹，将我环绕我却触摸不到你……

确认歌词后，转至AI音乐平台（例如Suno）完成音乐生成。本文重点为数字人操作，音乐生成环节不再详述。

视频合成与后期

最后一步，将生成的数字人音乐片段导入剪映，进行后期剪辑与调整。

首先调整片段顺序，利用智能字幕功能自动识别并生成歌词字幕。

至此，一个生动的AI音乐演唱视频便制作完成。借助AI工具，普通用户也能轻松产出高品质的AI音乐视频内容。

来源：互联网

上一篇 AI文旅微缩景观海报视频制作教程：热门城市新玩法 下一篇 免费AI证件照一键生成，告别花钱制作

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。