OpenAI开源BrowseComp 重塑Agent浏览器评测

2025年04月11日 00:09:26

《科创板日报》11日讯，今日凌晨，OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度，连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0，即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%，在自主搜索、信息整合、准确性校准方面非常优秀。

阅294.57W

我要评论

反馈意见

图片

欢迎您发表有价值的评论，发布广告和不和谐的评论都将会被删除，您的账号将禁止评论。

发表评论

热度

最新

cls-4roca611天前 · 陕西

🙂

(0)

回复0条回复

cls-180847211天前 · 上海

哈哈

(0)

回复0条回复

cls-3rpo3211天前 · 辽宁

利好泛微网络

(0)

回复0条回复

关联话题

人工智能

5.09W 人关注

+ 关注

首页

电报

话题

盯盘

VIP

FM

投研

下载

全部

加红

公司

看盘

港美股

基金

提醒