BytedanceのOmnihuman v1.5を@FAL経由で初めてテスト 入力は単一の静止画とオーディオ ファイルで、ビデオ入力はありませんでした。 第一印象: これがすべて 1 つの静止画からのものであることを考えると、シーンとの相互作用 (ここで彼が紙を扱っているのを見てください) は印象的で、物事が静的ではなく感じられます。 生成には時間がかかりましたが、結果には異論がありません。