1.

照片驱动模型

2.

人物照片(单人,清晰,正面)

3.

你想让数字人说的话(0 / 500 字)

4.

发音人:

5.

输出画面分辨率