oLLM — це легка бібліотека Python для локального висновування LLM з великим контекстом. Запустіть gpt-oss-20B, Qwen3-next-80B, Llama-3.1-8B на споживчому графічному процесорі ~$200 і лише 8 ГБ відеопам'яті. І це без будь-якої квантування – лише точність fp16/bf16. 100% відкритий вихідний код.