3月16日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。
今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1一半。
百度曾是国内最早一批发布大模型的厂商之一,在过去两年时间里,大模型领域国内大模型赛道竞争异常激烈,DeepSeek-R1以颠覆性姿态“杀”了进来,其开源+低价策略引发的"鲇鱼效应",迫使全球大模型厂商重新校准竞争维度。第一财经记者了解到,李彦宏在今年内部讲话中透露,百度将于下半年发布文心大模型的5.0版本,并加大AI应用商业化实践。接下来,百度还将在6月30日正式将文心大模型开源。
今日上午记者体验了百度原生多模态大模型文心4.5,用户可上传包括文档、图片、音频、视频的文件,让AI进行解读。记者上传了一张《哪吒》电影视频截图,就此询问文心4.5,但AI没能给出正确答案,而是称这是来自迪士尼动画电影《公主与青蛙》中的场景。不过在逻辑测试中,AI能准确识别脑筋急转弯的陷阱并给出回答,针对数学物理题、益智问答基本能给出准确回答。
文心大模型X1为深度思考模型,运用到的关键技术包括递进式强化学习、基于思维链和行动链的端到端训练、多元统一的奖励系统等,百度称在性能上对标DeepSeek-R1,具备“长思维链”。记者体验看到,除了联网搜索外,增加了多模态能力和多工具调用,能理解和生成图片,调用工具生成代码、图表等。目前DeepSeek-R1支持上传的附件仅识别文字。
在文本创作上,过去文心4.0的观点较为“端水”,4.5擅长写“锐评”;在图片理解方面,当记者再次拿出《哪吒》电影截图考考X1时,AI给出的答案是《快乐池塘》。记者在进一步的对话中告诉X1答错了,这是电影《哪吒》 场景后,AI表示感谢指正,经过分析后表示提供的图片场景确实出自电影《哪吒》。事实上AI每次错误都在拓宽技术边界,它的视觉理解也将在"犯错-修正"的螺旋中不断改进。
随着人工智能技术从基础问答向复杂推理跃迁,除了百度外,近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简单逻辑推导转向“认知重构”,试图让AI突破表层语义匹配,建立因果推理、价值判断及跨领域知识迁移能力。这种竞争不仅体现在模型性能上,各家更通过云计算捆绑、行业解决方案等生态卡位争夺B端市场。
此次豆包系列模型降价主要基于工程方面的优化。
①国产具身大模型首次获得汽车制造全场景验证;②2025全球人工智能技术大会在杭举办;③广西在AI技术研发与应用领域获重要突破。
作为新一轮技术革命的底层构造,大模型已经在诸多领域自证价值。但对于医院场景来说,大模型能在哪些关键环节提供帮助,能帮助到何种程度,仍然是一个未解的命题。
”瑕疵非常多,也很贵。”
①京东工业发布行业首个以供应链为核心的工业大模型Joy industrial;②昆仑万维发布天工超级智能体;③上海:探索AI大模型助力科研范式创新,建立算力设施的开放和优惠使用机制。