We zijn bezig met het opensourcen van BrowseComp ('Browsing Competition'), een nieuwe, uitdagende benchmark die is ontworpen om te testen hoe goed AI-agenten op internet kunnen surfen om moeilijk te vinden informatie te vinden. Het is als een online speurtocht... maar voor het browsen van agenten.