OpenAI推出高难度基准测试BrowseComp，挑战AI上网搜索能力

发布时间：2025-04-11 08:39:06

欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载官网地址

4月11日，OpenAI开源了名为BrowseComp的新基准测试，用于评估AI代理在互联网上查找复杂信息的能力。该测试包含1266个挑战性问题，覆盖影视、科技、历史等领域，难度高于现有测试如SimpleQA。

据AIGC开放社区消息，GPT-4o和GPT-4.5在该测试中的准确率仅为0.6%和0.9%，即使使用带浏览器功能的GPT-4o也仅为1.9%。而OpenAI最新发布的Deep Research模型准确率达到51.5%。

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

如有疑问请发送邮件至：bangqikeconnect@gmail.com

相关阅读

行情价格推荐

最新资讯

OpenAI推出高难度基准测试BrowseC

Coinbase现已上线Wayfinder (PROM

伯明翰本赛季英甲升级经历被拍成

卡洛斯来到皇马训练场参观并指导，

A股盘前播报 | 现货金价刷新历史

券商晨会精华 | 上市公司增持回购

销量遭遇滑铁卢之际特斯拉(TSLA.

中金：预计美联储会继续保持观望重

美众议院惊险通过预算框架特朗普

智通港股早知道 | 黄金价格逼近历