1.

照片驱动模型

2.

人物照片(单人,清晰,正面)

3.

你想让数字人说的话(0 / 500 字)

4.

发音人:

5.

输出画面分辨率

💡 提供一张照片与音频/文本,让照片中的人物说话或歌唱,并生成视频。