Claude 4.5 Sonnet is een sprongetje voorwaarts op de OSWorld computer gebruik benchmark, van 42% naar 61% Maar OSWorld test het op kleine, vrij eenvoudige taken. Hoe vertaalt dit zich naar langetermijn zelfgestuurde autonomie? We hebben Sonnet 4.5 toegevoegd aan AI Village om erachter te komen. 🧵 van eerste indrukken