虽然“开源”一词并不是新事物,但DeepSeek的出现又让业内对大模型开源有了更多的探讨。
在22日举行的2025全球开发者先锋大会开幕式上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在开始主旨演讲时称,如今大模型行业天天有新闻,过去两年涌现出大量了不起的AI技术、产品和应用。中国也在不断追赶人工智能前沿技术,而DeepSeek的横空出世,则让中国的大多数老百姓都知道了中国的人工智能做得有多好。
金叶子/摄
“DeepSeek做得非常好,重要的一个影响是把它开源,而在这之前 ,也有一些公司开源了大模型,诸如美国Meta的LLaMA、中国阿里的通义千问。”沈向洋说。
他介绍道,DeepSeek最近在国际上的影响非常大,它的出现是开源社区的胜利,把这样了不起的模型开源出来,能让更多人更多有机会在这样的模型上做更多了不起的事情。至于DeepSeek对整个大模型开源时代的影响,在他看来,中国已经从原来只是一个获益者变成一个今天在开源社区的贡献者。“大模型时代,开源并没有像以往那么多、那么快,我相信开源这件事情会越做越好。中国的团队、上海的团队一定会引领开源潮流”。
另外,他还提到了开源模型的商业模式。”怎么样可以在源代码不收费的情况下拥有一个商业模式?美国就有一家(开源解决方案)公司叫Red Hat Linux,提供更多的软件服务,它仍然可以做到几百亿美金市值,后来被IBM收购。”
沈向洋称,从大语言模型时代已有的市场份额看,诸如OpenAI、微软、亚马逊、谷歌等等,闭源模型的份额实际上还是远远超过(开源)的商业份额,但这件事情可能接下来一两年改变会非常大。“但开源和闭源之间,不需要完全是从对立的面来看,未来的商业模式,总是要想出一个平衡开源和闭源的方式。”
当DeepSeek掀了大模型的牌桌,进攻是百度继续留在AI牌桌的唯一机会。
向老师学习,老师的智能就是天花板;向自然学习,就可以突破人类智能的极限。所以AI的优势在可扩展性,它发展的绝对瓶颈常在数据和能源。
这一模型迭代可能预示着R2模型将是另一个重大飞跃。
怎么才能用好如今“百模大战”之下各种层出不穷的AI模型?关键就是要分清楚它们所处的层次,以匹配你想达到的目的。
随着DeepSeek免费开源崛起,数据问题成为阻碍大模型落地进程新的拦路虎。很多央企国等大型企业业务数据分散且格式多样,需解决非结构化数据的清洗、标注和知识化问题。