首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

Anthropic接棒OpenAI狙击谷歌,刷新AI编程模型热度

第一财经 2025-05-23 19:17:47 听新闻

作者:吕倩    责编:李娜

“过去建模型,现在我们在建产品。”Anthropic CEO表示。

大模型时代,几乎每次谷歌大会前夕,OpenAI都会以新品“狙击”其发布节奏。但此次,由于OpenAI备货不足,GPT-5尚未完成,Anthropic接棒了这项“任务”。

当地时间5月22日,谷歌I/O大会结束次日,Anthropic发布 Claude 4 系列大模型,包括旗舰版Claude Opus 4 与普适版Claude Sonnet 4,直接冲击谷歌Gemini 2.5 Pro在编程领域的热度。

刷新AI编程模型热度

由OpenAI 前员工们创立至今,逐渐发展为OpenAI最大竞品之一的Anthropic,主要定位为安全优先的AI解决方案提供商,专注于企业级市场,在混合推理模型与编程能力方面具备一定行业优势。此次新模型产品进一步加深其在编程领域的影响力。

技术层面,据Anthropic方面表示,Claude Opus 4作为编码模型,在复杂、长时间运行任务和智能体工作流中拥有持续的高性能;Claude Sonnet 4是Sonnet 3.7 的升级版,提供更强的代码和推理能力,同时更精确地响应用户指令。

两款模型新品均采用混合模型架构,提供快速响应和用于更深层次推理的扩展思维模式,均可在Anthropic API、亚马逊云科技Bedrock和Google Cloud的Vertex AI上使用。两相对比,Opus 4是Anthropic截至目前最强模型,专为复杂、长时间任务设计,适合需要深度推理和高级代理能力的场景。而Sonnet 4平衡了性能与效率,响应速度更快,适合日常开发和高流量任务,同时提供了更高的性价比。

目前AI编程赛道的明星公司Cursor与Claude绑定较深,Cursor中有四个Claude4模型可选——Claude Sonnet 4、Claude Sonnet 4 thinking、Claude Opus 4、Claude Opus 4 thinking。

此前谷歌发布的Gemini 2.5 Pro作为旗舰AI模型,优化了编程能力,在代码生成、调试和上下文理解等方面已表现出色。“小猫补光灯”开发者花生经过对比测评发现,Gemini 2.5 Pro在复杂长代码方面表现偶尔不错,但对指令的理解和遵从能力相比Claude稍差,视觉审美也比较糟糕,常常会有莫名其妙的表现。对比之下,Claude Sonnet 4原型细节内容更丰富,适合日常编程选择。

Opus是比Sonnet更大的模型,花生表示,在非编程的数学、推理等任务方面比Sonnet模型更好,但也更贵。尤其在Cursor中是需要启用Max模式,也就是每一次回答都需要单独计费的。但在常规的编程任务表现上并没有显著优于Sonnet模型,相对更适合上下文长度非常长的大型复杂项目,或者重构项目。

北理工前沿交叉科学研究院研究生丁纪翔也是在Cursor内体验的Claude 新模型,他对记者表示,Cursor里Opus属于Max标记的模型,需要单独付费,且相对速度较慢,小项目使用Sonnet足够了。

AI编程两大发展方向

5月以来,AI编程领域热点事件频发。

5月3日,苹果与Anthropic联手开发由AI驱动的Vibe Coding(氛围编程)平台;6日,OpenAI被曝将以30亿美元收购AI编程创业公司Windsurf;17日,OpenAI推出编程智能体Codex,可实现自动生成、调试和优化代码;20日,美团宣布将上线一款AI编程类工具“NoCode”;21日,腾讯披露公司已有约85%的程序员使用腾讯云代码助手CodeBuddy。

另在19日至23日,海外头部厂商微软、谷歌、Anthropic各自举办的大会均披露新模型在AI编程方面的技术与产品进展,AI编程行业经过多年发展,终于走向产品交付。

在峰瑞资本合伙人陈石看来,整个AI编程行业发展起始于2022年年底GPT-3.5的发布,同时行业也分拆为两大方向——其一是Copilot助手,人主导、AI辅助,如Github Copilot、Cursor、Windsurf、Trae等产品;其二是Agent智能体,AI主动执行,人类扮演监督者角色,如Devin。

锦秋基金合伙人臧天宇回顾过去半年多的投资项目发现,近60%的项目分布在应用层,其中,Agent方向占比近40%,也属于目前行业讨论最热烈的方向。Agent方向可分为两类,其中之一就是Coding Agent,专注于解决代码问题。长期来看,臧天宇认为,行业有望借助代码这一通用工具向更通用的智能Agent发展。

此次Anthropic大会现场,Anthropic CEO Dario Amodei(达里奥・阿莫代伊)表示:“我们不再教AI写代码,而是让它开始独立完成项目。过去建模型,现在我们在建产品。”硅谷AI编程独角兽Replit CEO Amjad Masad(阿姆贾德・马萨德)此前表示,“AI 的下一个阶段不再是我们告诉它怎么做,而是我们告诉它想做什么,它自己决定怎么做。AI不只是干活,而是开始决定任务怎么被拆解,流程怎么被安排。”

Anthropic的新模型为编程Agent完成产品交付打了个样,但整个行业的发展仍面临技术成熟、认知匹配,以及安全性等方面的待完善。陈石表示,Agent技术上目前面临模型能力、上下文收集能力两方面制约,Copilot这种协作类产品比较容易率先打开市场。

在丁纪翔的体验中,AI编程产品显著提高了工作效率,原本需要三周时间完成的工作量,现在叠加AI工具的辅助,三天即可完成。但目前AI编程的不足在他看来,主要在于机器还没有“自我意识”,需要人类先提出核心要点与任务方向,AI无法直接提供一个有价值的创意点。

“AI coding这个市场非常大,大家都处在早期,还看不到终局。”陈石表示,创业公司要做一些艰难的选择,找一些非共识的方向,Agent是一个可以考虑的选择。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com

文章作者

一财最热
点击关闭