Hoje, estamos a lançar o Power Retention, uma nova arquitetura além dos Transformers. Isso permite que os LLMs lidem com milhões de tokens de forma eficiente, desbloqueando aplicações de longo contexto que eram demasiado dispendiosas antes.