首页 > 新闻 > 资讯

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

GLM-5.1获Artificial Analysis全新Coding Agent基准开源第一

第一财经 2026-05-12 20:25:43

责编:高明妍

GLM-5.1获Artificial Analysis全新Coding Agent基准开源第一

据智谱消息,今日,全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基准上的表现。其中,闭源模型Opus 4.7(在Cursor CLI中运行)全球第一,GLM-5.1(在Claude Code中运行)取得开源第一。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com
相关阅读

AI Agent对消费行为与商业模式的底层颠覆

消费者作为自然人,存在不可突破的生物算力边界。人的工作记忆容量仅为4±1个组块,单位时间信息处理能力不超过100bit,无法同时处理多维度复杂信息、无法遍历海量商品选项、无法完成全周期成本收益的精准核算,只能做出“有限理性决策”。而消费决策的核心,正是信息的获取、分析与判断,其底层支撑就是算力。AI Agent的出现,彻底打破了自然人的算力边界,将消费决策的算力基础从“人脑生物算力”升级为“人工智能数字算力”,不仅重构了消费行为的底层逻辑,更将全面颠覆建立在“算力差、信息差”之上的所有现有商业模式。

11615 昨天 09:57

代理式人工智能(Agentic AI)——赋能企业转型的关键引擎

代理式人工智能(Agentic AI)正推动企业重新审视业务流和工作流,借助更加智能的自动化运营,实现企业的全方位转型。

1168 05-07 15:32

Agent扎堆上线,但AI行业真正开始算账了丨AI月报

AI行业已告别“烧钱造梦”阶段,正式进入以算力性价比和业务结果为导向的“效率验证”与“价值付费”新时代。

198 04-21 13:28

从“龙虾”到“爱马仕”,Agent越能干Token越费钱

行业从追求能力上限向平衡能力与成本转型。

1200 04-17 15:46

一财数智发布WISE Agent:AI时代,重塑品牌心智增长

一财数智WISE Agent是中国媒体业界与商学院业界首个AI品牌心智管理系统。

489 04-16 16:41
一财最热
点击关闭