Một điều nữa (nhỏ) cần nói: Giới thiệu mxbai-colbert-edge-v0 17M và 32M. Chúng là kết quả của một phương pháp dễ dàng tái tạo để huấn luyện các mô hình ColBERT từ đầu. Chúng cũng rất mạnh: biến thể 17M sẽ đứng đầu bảng xếp hạng LongEmbed cho các mô hình dưới 1B tham số.