第一次測試 Bytedance 的 Omnihuman v1.5,通過 @FAL 輸入是一個靜態圖像和音頻文件 - 沒有視頻輸入。 第一印象:考慮到這一切都是來自一個靜態圖像,與場景的互動(看看他在處理紙張)令人印象深刻,讓事情感覺不那麼靜態。 這花了一段時間生成,但我無法對結果提出異議!