Ollama v0.11.8 nyní ve výchozím nastavení povoluje flash attention u modelů OpenAI gpt-oss 20B a 120B pro systémy, které ji podporují!
32,06K