第八章：AI 数字人 — OmniHuman

即梦数字人是字节跳动旗下即梦AI推出的 AI 数字人视频生成工具。用户只需上传一张人物图片和一段音频（或输入文字），可快速生成与音频内容同步的动态数字人视频。

💡 四大核心优势

99% 拟真度 — 超逼真的人物形象
全场景覆盖 — 卡通/真人/3D风格全覆盖
零门槛操作 — 5分钟从小白到专业
免费商用 — 生成的数字人可免费商用

数字人模块的核心流程是：选模式 → 选生成档位 → 准备角色与音频 → 填写台词/动作描述 → 生成。下面结合第八章截图（image/8）按实际界面把每一步讲清楚。

按顺序走一遍即可跑通“数字人口播”。

图8-1：数字人模块关键入口

1

在底部模式栏选择「数字人」，进入数字人生成页。

2

点击「选择模型/模式」，先定生成档位（大师/快速/基础）。

3

上传角色照片（建议清晰正面、五官完整无遮挡），用于锁定人物长相与口型区域。

4

选择系统音色，或点击「上传音频」使用自己的音频/克隆音色（需合规审核）。

5

填写「说话内容」，并在「动作描述」里补充表情/镜头/动作（可选但强烈建议）。

⚠️ 角色照片选取要点

优先选择正脸清晰、嘴唇边界明确、光线均匀的照片；尽量避免遮挡（口罩/手挡脸/夸张滤镜）。嘴部细节越清楚，对口型越自然。

图8-2：模式选择（大师 / 快速 / 基础）

✨ 大师模式

适合：品牌口播、课程讲解、重点成片
建议：用于最终成片，对口型与表情更稳

⚡ 快速模式

适合：预览脚本、批量试音色
建议：先跑通节奏，满意后切大师

🧩 基础模式

适合：轻量演示、简单对话
建议：对画面与表情要求不高时使用

动作描述示例（可直接复制改字）

正对镜头，中景，语速自然，轻微点头，微笑亲和；抬手指向产品要点；镜头轻微推近，整体稳定不抖动