OpenAI开源BrowseComp，重塑Agent浏览器评测

狐呼网 • 2025年4月11日下午2:42 • AI • 阅读 47

今日凌晨，OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度，连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0，即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%，在自主搜索、信息整合、准确性校准方面非常优秀。（财联社）

原创文章，作者：狐呼网，如若转载，请注明出处：https://www.ihuho.com/7086.html

0 0

关于作者

狐呼网

1.2K 文章

1 评论

0 粉丝

狐呼网，由资深新媒体人梁志镅创建。是一个前沿的新媒体内容生态服务网站，致力为新媒体人打造的学习交流网站

长安汽车与腾讯合作再深化，共建智能驾驶数据闭环

上一篇 2025年4月11日下午2:41

多级补贴叠加赋能，家电消费快速增长

下一篇 2025年4月11日下午2:42

AI

Anthropic推出首款混合推理模型Claude 3.7 Sonnet

人工智能初创公司Anthropic宣布推出Claude 3.7 Sonnet，称这是迄今为止最智能的模型，也是市场上首款混合推理模型。该公司介绍，Claude 3.7 Sonnet…

狐呼网
2025年2月25日
00
AI

东土科技：工业操作系统在具身机器人领域的业务仍处于投入期

东土科技发布股票交易异动公告称，公司注意到近期投资者对公司工业操作系统在具身机器人领域布局的关注度较高，该业务处于投入期，业务进展可能面临技术路线风险、市场应用风险等不确定性因素影…

狐呼网
2025年3月18日
00
AI

多家地方算力平台接入阿里通义千问QwQ-32B

自3月6日以来，上海超级计算中心、广州算力中心、武汉人工智能计算中心、南京人工智能计算中心，宁波人工智能超算中心、苏州市公共算力服务平台、长春算力中心、西安雁塔人工智能中心等地方算…

狐呼网
2025年3月18日
00
AI

智谱AI公司名称变更

天眼查App显示，近日，北京智谱华章科技有限公司发生工商变更，企业名称变更为北京智谱华章科技股份有限公司，同时部分主要人员发生变更。该公司成立于2019年6月，法定代表人为刘德兵，…

狐呼网
2025年3月29日
00
AI

深圳市宝安区政务服务机器人“小宝”上岗

狐呼网获悉，4月15日18点10分，深圳市宝安区政务服务中心AI智能体机器人“小宝”收到企业办事资料递交，并开出第一份收件回执。借助人工智能应用，宝安“夜间政务”突破了“时间错位”…

狐呼网
2天前
00
AI

联想AI桌面助手接入豆包大模型

联想宣布与火山引擎达成合作，将豆包大模型整合进其AI桌面助手如意（AI Stick），推出AI搜索、AI写作、AI聊天三大新功能，标志着如意在个性化AI服务方面迈出了重要一步。 A…

狐呼网
2024年12月27日
00
AI

联想创投贺志强：持续布局新型计算技术突破和AI新场景推动的计算架构演变

狐呼网获悉，3月31日，联想集团2025/26财年誓师大会第一站在京召开。会上，联想集团高级副总裁、联想创投集团总裁贺志强表示，硅基智能大脑会逐年进化，未来将迎来多智能体共存的硅基…

狐呼网
2025年3月31日
00
AI

阿里云与南京大学联合启动人工智能人才培养合作计划

狐呼网获悉，据阿里云消息，南京大学与阿里云近日宣布启动人工智能人才培养合作计划。据了解，南京大学是首个成立人工智能学院的C9高校，阿里云通过“云工开物”计划为南京大学所有在校生提供…

狐呼网
2025年3月31日
00
AI

傅利叶开源人形机器人硬件本体

4月11日，通用机器人(16.310, 0.13, 0.80%)公司傅利叶发布首款开源人形机器人Fourier N1，并同步开放涵盖物料清单、设计图纸、装配指南、基础操作软件在内的…

狐呼网
6天前
00
AI

饿了么推出“AI入驻智能经理” 新商家上线只需 5 分钟

饿了么宣布推出一款名为 “AI 入驻智能经理” 的智能助手，旨在简化新商家的入驻流程。这一创新工具的推出，使得商家在启动外卖业务时，整个入驻过程大幅缩短，最快只需5分钟便可完成所有…

狐呼网
2025年4月4日
00