Hôm nay, chúng tôi phát hành Power Retention, một kiến trúc mới vượt ra ngoài Transformers. Nó cho phép LLM xử lý hàng triệu token một cách hiệu quả, mở khóa các ứng dụng ngữ cảnh dài mà trước đây quá tốn kém.