第一次测试 Bytedance 的 Omnihuman v1.5,通过 @FAL 输入是一个静态图像和音频文件 - 没有视频输入。 第一印象:考虑到这一切都是来自一个静态图像,与场景的互动(看看他在处理纸张)令人印象深刻,让事情感觉不那么静态。 这花了一段时间生成,但我无法对结果提出异议!