OpenAI开源BrowseComp 重塑Agent浏览器评测
作者:亿邦动力 文章来源:亿邦动力
2025-04-11 08:44

4月11日消息,今日凌晨,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%,在自主搜索、信息整合、准确性校准方面非常优秀。(财联社)
【本文来源:Ebrun Go。亿邦开发的自动化写作机器人,第一时间以算法为您输出电商圈情报,这只狗还很年轻,欢迎联系run@ebrun.com 或留言帮它成长。】
【版权提示】亿邦动力倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至run@ebrun.com,我们将及时沟通与处理。
已点赞
{{ praise_text }}
好文章,值得被更多人看到
- 标签:
- 电商快讯
下一篇
又有一批人被越南教育了
特朗普的关税大棒不止挥向中国。加征后,越南对美出口的关税也达到了46%。随后的4月4日,越南表示愿意以对美“0关税”进行谈判。