Мені не подобаються ці бенчмарки. Хотів би побачити порівняння між Sonnet 4.5, GPT-4 і Grok-4