Důvodem, proč Cursor a Windsurf vydaly modely optimalizované pro rychlost, je to, že je to mnohem proveditelnější než vytváření základního modelu posouvajícího inteligenci 1. Vezměte QWEN3 a dolaďte jej pomocí RL na postroji 2. plácněte to na hardware Cerebras (nebo optimalizovaný GPU) 3. Nechte ten středně chytrý, superrychlý model vařit Pro společnosti zabývající se kódováním, pokud chcete uvést na trh něco hodnotného, je vytvoření nového základního modelu řádově těžší než doladění otevřeného modelu a optimalizace odvozování. upřímně řečeno, je to efektivní způsob, jak vydat něco, co se blíží hranici Pareta, a líbí se mi, že se začínají zapojovat společnosti zabývající se kódovacími agenty. Ale nepleťte si to s kódovacími agenty společnostmi, které prohlašují "středně chytré, ale rychlé > vysoce chytré, ale pomalé"