首页 > 新闻 > 科技

分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

Anthropic接棒OpenAI狙击谷歌，刷新AI编程模型热度

第一财经 2025-05-23 19:17:47 听新闻

作者：吕倩责编：李娜

“过去建模型，现在我们在建产品。”Anthropic CEO表示。

大模型时代，几乎每次谷歌大会前夕，OpenAI都会以新品“狙击”其发布节奏。但此次，由于OpenAI备货不足，GPT-5尚未完成，Anthropic接棒了这项“任务”。

当地时间5月22日，谷歌I/O大会结束次日，Anthropic发布 Claude 4 系列大模型，包括旗舰版Claude Opus 4 与普适版Claude Sonnet 4，直接冲击谷歌Gemini 2.5 Pro在编程领域的热度。

刷新AI编程模型热度

由OpenAI 前员工们创立至今，逐渐发展为OpenAI最大竞品之一的Anthropic，主要定位为安全优先的AI解决方案提供商，专注于企业级市场，在混合推理模型与编程能力方面具备一定行业优势。此次新模型产品进一步加深其在编程领域的影响力。

技术层面，据Anthropic方面表示，Claude Opus 4作为编码模型，在复杂、长时间运行任务和智能体工作流中拥有持续的高性能；Claude Sonnet 4是Sonnet 3.7 的升级版，提供更强的代码和推理能力，同时更精确地响应用户指令。

两款模型新品均采用混合模型架构，提供快速响应和用于更深层次推理的扩展思维模式，均可在Anthropic API、亚马逊云科技Bedrock和Google Cloud的Vertex AI上使用。两相对比，Opus 4是Anthropic截至目前最强模型，专为复杂、长时间任务设计，适合需要深度推理和高级代理能力的场景。而Sonnet 4平衡了性能与效率，响应速度更快，适合日常开发和高流量任务，同时提供了更高的性价比。

目前AI编程赛道的明星公司Cursor与Claude绑定较深，Cursor中有四个Claude4模型可选——Claude Sonnet 4、Claude Sonnet 4 thinking、Claude Opus 4、Claude Opus 4 thinking。

此前谷歌发布的Gemini 2.5 Pro作为旗舰AI模型，优化了编程能力，在代码生成、调试和上下文理解等方面已表现出色。“小猫补光灯”开发者花生经过对比测评发现，Gemini 2.5 Pro在复杂长代码方面表现偶尔不错，但对指令的理解和遵从能力相比Claude稍差，视觉审美也比较糟糕，常常会有莫名其妙的表现。对比之下，Claude Sonnet 4原型细节内容更丰富，适合日常编程选择。

Opus是比Sonnet更大的模型，花生表示，在非编程的数学、推理等任务方面比Sonnet模型更好，但也更贵。尤其在Cursor中是需要启用Max模式，也就是每一次回答都需要单独计费的。但在常规的编程任务表现上并没有显著优于Sonnet模型，相对更适合上下文长度非常长的大型复杂项目，或者重构项目。

北理工前沿交叉科学研究院研究生丁纪翔也是在Cursor内体验的Claude 新模型，他对记者表示，Cursor里Opus属于Max标记的模型，需要单独付费，且相对速度较慢，小项目使用Sonnet足够了。

AI编程两大发展方向

5月以来，AI编程领域热点事件频发。

5月3日，苹果与Anthropic联手开发由AI驱动的Vibe Coding（氛围编程）平台；6日，OpenAI被曝将以30亿美元收购AI编程创业公司Windsurf；17日，OpenAI推出编程智能体Codex，可实现自动生成、调试和优化代码；20日，美团宣布将上线一款AI编程类工具“NoCode”；21日，腾讯披露公司已有约85%的程序员使用腾讯云代码助手CodeBuddy。

另在19日至23日，海外头部厂商微软、谷歌、Anthropic各自举办的大会均披露新模型在AI编程方面的技术与产品进展，AI编程行业经过多年发展，终于走向产品交付。

在峰瑞资本合伙人陈石看来，整个AI编程行业发展起始于2022年年底GPT-3.5的发布，同时行业也分拆为两大方向——其一是Copilot助手，人主导、AI辅助，如Github Copilot、Cursor、Windsurf、Trae等产品；其二是Agent智能体，AI主动执行，人类扮演监督者角色，如Devin。

锦秋基金合伙人臧天宇回顾过去半年多的投资项目发现，近60%的项目分布在应用层，其中，Agent方向占比近40%，也属于目前行业讨论最热烈的方向。Agent方向可分为两类，其中之一就是Coding Agent，专注于解决代码问题。长期来看，臧天宇认为，行业有望借助代码这一通用工具向更通用的智能Agent发展。

此次Anthropic大会现场，Anthropic CEO Dario Amodei（达里奥・阿莫代伊）表示：“我们不再教AI写代码，而是让它开始独立完成项目。过去建模型，现在我们在建产品。”硅谷AI编程独角兽Replit CEO Amjad Masad（阿姆贾德・马萨德）此前表示，“AI 的下一个阶段不再是我们告诉它怎么做，而是我们告诉它想做什么，它自己决定怎么做。AI不只是干活，而是开始决定任务怎么被拆解，流程怎么被安排。”

Anthropic的新模型为编程Agent完成产品交付打了个样，但整个行业的发展仍面临技术成熟、认知匹配，以及安全性等方面的待完善。陈石表示，Agent技术上目前面临模型能力、上下文收集能力两方面制约，Copilot这种协作类产品比较容易率先打开市场。

在丁纪翔的体验中，AI编程产品显著提高了工作效率，原本需要三周时间完成的工作量，现在叠加AI工具的辅助，三天即可完成。但目前AI编程的不足在他看来，主要在于机器还没有“自我意识”，需要人类先提出核心要点与任务方向，AI无法直接提供一个有价值的创意点。

“AI coding这个市场非常大，大家都处在早期，还看不到终局。”陈石表示，创业公司要做一些艰难的选择，找一些非共识的方向，Agent是一个可以考虑的选择。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部：banquan@yicai.com