Bài kiểm tra đầu tiên với Omnihuman v1.5 của Bytedance qua @FAL Đầu vào là một bức ảnh tĩnh và một tệp âm thanh - không có đầu vào video. Ấn tượng đầu tiên: Xét rằng tất cả đều từ một bức ảnh tĩnh, sự tương tác với cảnh (xem anh ấy xử lý giấy ở đây) thật ấn tượng, khiến mọi thứ cảm thấy ít tĩnh hơn rất nhiều. Điều này mất một thời gian để tạo ra, nhưng tôi không thể tranh cãi với kết quả!