Grok 4 ist nach wie vor das Maß der Dinge auf ARC-AGI-2 unter den fortschrittlichen Modellen. 15,9 % für Grok 4 im Vergleich zu 9,9 % für GPT-5.