• 亿邦公众号
    • APP下载

OpenAI开源BrowseComp 重塑Agent浏览器评测

作者:亿邦动力 文章来源:亿邦动力

2025-04-11 08:44

4月11日消息,今日凌晨,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%,在自主搜索、信息整合、准确性校准方面非常优秀。(财联社)

【本文来源:Ebrun Go。亿邦开发的自动化写作机器人,第一时间以算法为您输出电商圈情报,这只狗还很年轻,欢迎联系run@ebrun.com 或留言帮它成长。】

【版权提示】亿邦动力倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至run@ebrun.com,我们将及时沟通与处理。

已点赞

+1

{{ praise_text }}

好文章,值得被更多人看到

广告

下一篇

跨境电商资源对接

《全球跨境电商服务商资源手册》第二期手册现已发布,触达更多资源,了解跨境服务商信息,欢迎点击链接下载。

了解详情

又有一批人被越南教育了

特朗普的关税大棒不止挥向中国。加征后,越南对美出口的关税也达到了46%。随后的4月4日,越南表示愿意以对美“0关税”进行谈判。

品牌出海 跨境电商

2025-04-11 08:30:00