🚨 DeepMind heeft eindelijk het Veo3-paper uitgebracht, dat laat zien wat we allemaal beseffen door te spelen met video-gen modellen. Net als LLM's is visueel redeneren een emergente eigenschap van het trainen op een enorme hoeveelheid video. Het kan taken oplossen die niet expliciet in de trainingsdata staan. "Veo 3 is het GPT-3-moment voor visueel redeneren"
Bron:
359,66K