Apriel-1.5-15B-Thinker da ServiceNow: AI Frontier em uma única GPU
Este modelo multimodal de 15 bilhões de parâmetros com pesos abertos alcança um desempenho de raciocínio de ponta, igualando modelos 8-10x seu tamanho—tudo isso sem uma fase de RL!
Self-Forcing++ para geração de vídeo em escala de minutos
O novo método da ByteDance gera vídeos de alta qualidade de até 4 min 15 seg! Ele escala modelos de difusão sem professores de vídeo longo ou re-treinamento, preservando a fidelidade e a consistência.
Apresentando o StockBench: Um Novo Benchmark para Agentes Financeiros LLM
Este benchmark avalia se os agentes LLM podem negociar ações de forma lucrativa em mercados reais. Avalia o desempenho usando sinais de mercado diários (preços, fundamentos, notícias) e métricas financeiras, revelando insights chave sobre suas capacidades.