Estamos abrindo o BrowseComp ("Competição de Navegação"), um novo e desafiador benchmark projetado para testar o quão bem os agentes de IA podem navegar na internet para encontrar informações difíceis de localizar. É como uma gincana online... mas para agentes de navegação.