分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

百度发布两款大模型，对标DeepSeek、聚焦多模态

第一财经 2025-03-16 12:07:37 听新闻

作者：刘佳责编：胡军华

百度还将在6月30日正式将文心大模型开源。

3月16日，在文心一言正式发布两周年后，百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。

今日文心大模型4.5在百度智能云千帆大模型平台上线，输入价格为0.004元/千tokens；文心大模型X1输入价格0.002元/千tokens，为DeepSeek R1一半。

百度曾是国内最早一批发布大模型的厂商之一，在过去两年时间里，大模型领域国内大模型赛道竞争异常激烈，DeepSeek-R1以颠覆性姿态“杀”了进来，其开源+低价策略引发的"鲇鱼效应"，迫使全球大模型厂商重新校准竞争维度。第一财经记者了解到，李彦宏在今年内部讲话中透露，百度将于下半年发布文心大模型的5.0版本，并加大AI应用商业化实践。接下来，百度还将在6月30日正式将文心大模型开源。

今日上午记者体验了百度原生多模态大模型文心4.5，用户可上传包括文档、图片、音频、视频的文件，让AI进行解读。记者上传了一张《哪吒》电影视频截图，就此询问文心4.5，但AI没能给出正确答案，而是称这是来自迪士尼动画电影《公主与青蛙》中的场景。不过在逻辑测试中，AI能准确识别脑筋急转弯的陷阱并给出回答，针对数学物理题、益智问答基本能给出准确回答。

文心大模型X1为深度思考模型，运用到的关键技术包括递进式强化学习、基于思维链和行动链的端到端训练、多元统一的奖励系统等，百度称在性能上对标DeepSeek-R1，具备“长思维链”。记者体验看到，除了联网搜索外，增加了多模态能力和多工具调用，能理解和生成图片，调用工具生成代码、图表等。目前DeepSeek-R1支持上传的附件仅识别文字。

在文本创作上，过去文心4.0的观点较为“端水”，4.5擅长写“锐评”；在图片理解方面，当记者再次拿出《哪吒》电影截图考考X1时，AI给出的答案是《快乐池塘》。记者在进一步的对话中告诉X1答错了，这是电影《哪吒》场景后，AI表示感谢指正，经过分析后表示提供的图片场景确实出自电影《哪吒》。事实上AI每次错误都在拓宽技术边界，它的视觉理解也将在"犯错-修正"的螺旋中不断改进。

随着人工智能技术从基础问答向复杂推理跃迁，除了百度外，近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简单逻辑推导转向“认知重构”，试图让AI突破表层语义匹配，建立因果推理、价值判断及跨领域知识迁移能力。这种竞争不仅体现在模型性能上，各家更通过云计算捆绑、行业解决方案等生态卡位争夺B端市场。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部：banquan@yicai.com