DeepSeek用更低成本训练出性能等效的大模型,引发业界对大模型效率革命的思考。对于颠覆性创新来说,要考虑哪些因素?
在26日—27日举行的“浦江创新论坛——科学学上海论坛·2025科技创新智库国际研讨会”上,全国政协委员、科技部原副部长李萌分享了几点思考。在他看来,工程创新成为成就颠覆性创新更重要的形式,比如DeepSeek本质上是工程创新,展示了工程创新对于推动大模型创新发展的巨大潜力,不仅大模型如此,相关企业的算力硬件实现性能大幅度提升也得益于此。下一阶段人工智能的发展更考验软硬协同的能力,在人形机器人,高级别自动驾驶等具身领域,越来越显示出工程优化的重要性。
“过去有一个问题今天仍然在问,为什么蒸汽机革命没有发生在伦敦,而是在曼城?今天恰恰存在对工程创新催生颠覆性创新认识不够的问题,当理论遇到物理极限以后,工程创新能够打开新的空间,这就是在多数时候看到工程界比学术界更乐观的原因。”他说。
李萌认为,未来理论突破和工程优化将交替引领颠覆性创新。他解释称,从“0到1”和从“1到100”都是可以产生颠覆性创新的过程。从摩尔定律到尺度定律技术进步的通道轨迹表明,重大技术的突破往往是基础理论和工程应用交替式引领上升。认识到这一点,对于完善中国特色科研组织和研发模式具有重大意义。
他还说, 人工智能本身是一个极综合领域,大模型的效率革命是复合因素推动的,架构、策略、极致的软硬件协同的作用,体现了从单一维度向多阶段复合性理解转变。复合性创新替代单一路径,也适应于其他领域,颠覆性创新越来越在交叉融合的复合性创新中产生。
而如何度量颠覆性创新?效率最优成为新维度。
他解释称,之前研究颠覆性创新从技术维度、市场维度、效果感受维度探索度量方法。DeepSeek走出了一条低算力、低成本、性能等效的大模型发展之路,能效比的地位上升了。过去是大力出奇迹,现在行业竞争逻辑变了,效率在决定是否有颠覆性这方面起到了很重要的作用。也就是说没有高性能、高能效比就没有颠覆性创新,对于能效比的追求也会倒逼业内探索能力等效的途径和措施,未来大模型技术发展将长期处于尺度定律和效率革命的动态平衡,且这个趋势并不局限于在大模型一个领域。同时,开源开放是支撑颠覆性创新生态规模不可缺少的方式。
但李萌也提醒,在重视颠覆性创新的同时,也要同步考量可能出现的颠覆性危害。以往的科技革命和产业变革都是建立在可解释的科学原理和透明的技术路线上,而今天的大模型智能涌现具有不完全可解释性。越接近通用智能越要保持敏捷治理,形成创造性技术与社会良性互动,否则带来的危害也可能是颠覆性的。
他认为,相较而言,人们比较重视颠覆性技术和颠覆性创新,而对相伴的治理问题认识两极分化,要么置之不理,要么做出人工智能会毁灭人类的判断。随着大模型推理能力的增强,问题越来越紧迫,前一段时间有开发者发现大模型越聪明就越不听话,模型的大小和遵守指令有时会呈负相关。
Meta在这场激烈的AI竞争中全力以赴,该公司已经宣布斥资100亿美元在美国路易斯安那州一处农田上建设西半球最大的数据中心,该地块面积相当于1700个足球场。
以及80余款“全球首发”或“中国首秀”的重磅新品,规模创历届之最。
360集团创始人周鸿祎表示,当前人工智能发展已经进入下半场,智能体成为主角。智能体技术正推动人工智能从“会说话”向“能干活”跨越。
AI的发展又来到了一个拐点,“我们正处在Agentic AI爆发的前夜。”