I dag lanserer vi Power Retention, en ny arkitektur utover Transformers. Det gjør det mulig for LLM-er å håndtere millioner av tokens effektivt, og låse opp applikasjoner med lang kontekst som var for kostbare før.