We’re releasing BrowseComp, which stands for Browsing Competition. 🏎️ Think of it like coding or math competitions — while these contests may not perfectly reflect real-world SWE or mathematical research, they do capture a spark of intelligence. This is THE benchmark we should care about when evaluating the intelligence of deep research-like browsing agents.
OpenAI
OpenAI11 avr. 2025
Nous open-sourçons BrowseComp ("Compétition de Navigation"), une nouvelle référence stimulante conçue pour tester la capacité des agents IA à naviguer sur Internet pour trouver des informations difficiles à localiser. C'est comme une chasse au trésor en ligne... mais pour les agents de navigation.
464,96K