“大模型厂商卷生卷死,开发者无所适从。”在百度AI开发者大会上,百度董事长李彦宏这样描述大模型和应用开发者的生存状态。
他援引数据称,开源中国一年新增150万开发者,但同时开发者也充满焦虑。去年第四季度国内有49个大模型更新发布,到今年一季度这一数字增长至55个,最多的时候一周有8个模型。大模型迭代速度快,模型能力越来越强,有开发者担心所做的应用被大模型迭代快速覆盖掉,因此白费功夫,不敢放心大胆地做应用。
“这其实是双刃剑。”李彦宏说,一方面开发者确实需要理解技术发展的趋势,避开大模型自身发展的延长线;另一方面,日益强大的模型能力为开发者打开更多可能性,“只要找对场景,选对基础模型,有时候还要学一点调模型的方法,在此基础上做出来的应用是不会过时的。”
他强调,“没有应用,芯片、模型都没有价值。模型会有很多,但未来真正统治这个世界的是应用,应用才是王者。”
今年以来,当DeepSeek掀了大模型的牌桌,进攻是百度AI继续留在牌桌的唯一机会。
李彦宏透露,百度已有多个应用接入满血版DeepSeek,产生了不错的效果,为此百度专门举办一场讨论DeepSeek的分论坛。但DeepSeek不是万能的,比如它只能处理文本,还不能理解声音、图片、视频等多媒体内容,百度很多客户需要多模态能力,此外DeepSeek在一些场景幻觉比较高,“如果数字人直播幻觉出来一个买一赠一的优惠,商家要赔惨了。”此外还有速度慢、价格贵等问题。
当天,百度发布文心大模型4.5 Turbo和深度思考模型X1 Turbo,相比文心4.5和X1 Turbo。二者速度更快,价格分别下降80%和50%。此外,李彦宏发布高说服力数字人、通用超级智能体心响APP、内容操作系统沧舟OS等多款AI应用,覆盖AI数字人、代码智能体、多智能体协作等赛道,并宣布百度全自研的3万卡集群点亮,可同时承载多个千亿参数大模型的全量训练,支持1000个客户同时做百亿参数的大模型精调。
围绕应用,去年时李彦宏表示,智能体是他最看好的AI原生应用发展方向,当时还是“非共识”,到了今年智能体已成为AI应用的代名词。其中,代码智能体Coding Agent,是最近半年AI应用进展最快、最火的赛道。全球陆续涌现了cursor、devin、lovable等一系列代码智能体。在百度内部,工程师普遍使用的是文心快码等辅助工具写代码,但百度也有好几万非技术人员,他们则会使用无代码编程工具“秒哒”。
百度今日对“秒哒”进行升级, 李彦宏举例, 基于秒哒无代码开发工具,一个陕西的果农,做了一个能卖苹果、自动算账的应用;一位退休师傅,创建了一个可以进行车位、访客、维修登记和社区活动公告的居民服务应用等等。
李彦宏说,全球有近3000万程序员,有80亿人,当技术的门槛逐渐消失,每个人都可以具备程序员的能力。“如果你还像原来那样天天一行一行地写代码,是没有赢的可能性的。”
朱啸虎表示,DeepSeek爆火之后,开源生态将主导基座模型,而腾讯是DeepSeek带动技术平权后的最大受益者。
向老师学习,老师的智能就是天花板;向自然学习,就可以突破人类智能的极限。所以AI的优势在可扩展性,它发展的绝对瓶颈常在数据和能源。
DeepSeek的广泛接入引发了关于自研大模型必要性的讨论,尽管其低成本和开源特性推动了市场热潮,但自研在满足特定需求和技术主导权方面仍具有重要价值。
怎么才能用好如今“百模大战”之下各种层出不穷的AI模型?关键就是要分清楚它们所处的层次,以匹配你想达到的目的。
随着DeepSeek免费开源崛起,数据问题成为阻碍大模型落地进程新的拦路虎。很多央企国等大型企业业务数据分散且格式多样,需解决非结构化数据的清洗、标注和知识化问题。