Swarm Inference змінює правила гри для індустрії штучного інтелекту. Щоб зрозуміти чому, потрібно почати з того, як виглядає повернення для розробників звичайних постачальників висновків (GPU в центрах обробки даних). Одягніть капелюх інвестора: -Ви бачите бум штучного інтелекту. Ви хочете взяти участь. Купівля графічних процесорів, їх розміщення десь і здача в оренду – це суть цієї бізнес-моделі. - Ви починаєте моделювання, ви будуєте свій PnL. Дата-центри, сервери, підключення і т.д. Це ваші капітальні інвестиції та COGS. Top-line виділяється тільки для графічних процесорів високого класу. Електроенергія коштує дорого. Управління не є тривіальним. - Ви приходите до швидкого висновку: віддача... М'яко кажучи, грубо. Якщо ви виконаєте цю вправу, то отримаєте простий TLDR: Внесок в економіку штучного інтелекту на рівні інфраструктури працює лише з масштабом, або деякі підключаються до потужності/простору. Інфраструктура логічного висновку стала товаром широкого вжитку, а врожайність скоротилася. Я продовжую намагатися знайти спосіб нарізати і нарізати це кубиками, але мені просто здається, що тут просто немає альфи. З технологічної точки зору, все це є наслідком того, як Inference історично працював сьогодні. Вам потрібна щільність обчислень. Висока пропускна здатність шини, висока відеопам'ять тощо. Swarm Inference змінює правила гри, оскільки щільність обчислень більше не є вимогою. Наведені вище CAPEX і COGS є наслідком необхідності щільності обчислень. Але якщо вам не потрібна щільність обчислень, то вам і не потрібні дата-центри. Іншими словами, окремим постачальникам інфраструктури не потрібно проходити бар'єр масштабування, щоб взяти участь. І якщо вам не потрібен мінімальний масштаб для участі, то, можливо, навіть окремий будинок може зробити свій внесок у розвиток штучного інтелекту з віддачею, яка дійсно має сенс. Ось чому Swarm Inference змінює правила гри. Це інновація, яка змінюється там, де можна знайти альфа. Вітаємо команду Fortytwo зі зміною парадигми.