BrowseComp-Plus

Fair and Disentangled Evaluation of Deep-Research Agents

Loading benchmark data...

If you found BrowseComp-Plus useful, please cite us at: