🧑

第八章:AI 数字人 — OmniHuman

一张图让人物开口说话 · 零出镜也能做专业主播 · 免费商用级数字人

🧑 什么是即梦 AI 数字人?

即梦数字人是字节跳动旗下即梦AI推出的 AI 数字人视频生成工具。用户只需上传一张人物图片和一段音频(或输入文字),可快速生成与音频内容同步的动态数字人视频。

💡 四大核心优势

99% 拟真度 — 超逼真的人物形象
全场景覆盖 — 卡通/真人/3D风格全覆盖
零门槛操作 — 5分钟从小白到专业
免费商用 — 生成的数字人可免费商用

🎯 数字人功能详解

数字人模块的核心流程是:选模式 → 选生成档位 → 准备角色与音频 → 填写台词/动作描述 → 生成。下面结合第八章截图(image/8)按实际界面把每一步讲清楚。

✅ 入口与步骤

按顺序走一遍即可跑通“数字人口播”。

图8-1:数字人模块关键入口(模式、角色、音频、台词与动作描述)

图8-1:数字人模块关键入口

1

在底部模式栏选择「数字人」,进入数字人生成页。

2

点击「选择模型/模式」,先定生成档位(大师/快速/基础)。

3

上传角色照片(建议清晰正面、五官完整无遮挡),用于锁定人物长相与口型区域。

4

选择系统音色,或点击「上传音频」使用自己的音频/克隆音色(需合规审核)。

5

填写「说话内容」,并在「动作描述」里补充表情/镜头/动作(可选但强烈建议)。

⚠️ 角色照片选取要点

优先选择正脸清晰、嘴唇边界明确、光线均匀的照片;尽量避免遮挡(口罩/手挡脸/夸张滤镜)。嘴部细节越清楚,对口型越自然。

🎛️ 模式怎么选(成本 vs 效果)

图8-2:模式选择(大师 / 快速 / 基础)

图8-2:模式选择(大师 / 快速 / 基础)

✨ 大师模式

适合:品牌口播、课程讲解、重点成片
建议:用于最终成片,对口型与表情更稳

⚡ 快速模式

适合:预览脚本、批量试音色
建议:先跑通节奏,满意后切大师

🧩 基础模式

适合:轻量演示、简单对话
建议:对画面与表情要求不高时使用

📝 台词与动作描述(最容易出效果的写法)

动作描述示例(可直接复制改字)

正对镜头,中景,语速自然,轻微点头,微笑亲和;抬手指向产品要点;镜头轻微推近,整体稳定不抖动

💼 数字人应用场景

场景说明推荐风格
知识博主课程讲解、科普视频写实风格、专业形象
电商带货产品介绍、口播视频亲和力强的真人风格
企业宣传品牌介绍、新闻播报正式着装、3D虚拟人
娱乐内容虚拟偶像、脱口秀卡通风格、夸张表情
教育培训课程录制、讲师出镜专业教师形象