4月24日上午开盘,商汤科技股价大涨超过30%后紧急暂停交易。
当天下午,商汤发布公告称,4月23日,公司于上海临港AIDC举办技术交流日活动,其中本公司推出6000亿参数大模型(日日新5.0),在知识、数学、推理和代码能力方面大幅提升,综合性能全面对标GPT-4Turbo。同时,公司推出行业大模型一体机版本以及移动端侧大模型SDK版本。董事会注意到最近B类股份的交易价格及交易量发生不寻常波动,B类股份于4月24日上午11时15分起暂停买卖。本公司已向联交所申请B类股份于4月25日上午9时正起恢复买卖。
4月23日,商汤科技举办技术交流日活动,发布行业首个"云、端、边"全栈大模型产品矩阵,以满足不同规模场景的应用需求,并升级"日日新5.0"大模型体系。
商汤科技董事长兼CEO徐立在发布会上表示,日日新5.0大部分核心测试集指标上全面对标甚至已经超过OpenAI目前最先进的AI大模型GPT-4 Turbo。本次更新主要聚集增强了知识、数学、推理及代码能力。
徐立还称,今年是大模型在端侧应用爆发的元年。"去年我们主要聚焦在模型本身的参数发布,而今年则更多关注行业场景的落地,以行业来驱动人工智能的爆发。"
他说道,如果几十亿个端侧设备都在不停地调用大模型,将需要消耗巨大算力,而且没有任何一个服务器能够支撑得起,因此具有不同场景下端侧应用能力的"小模型"将是AI模型普及最关键的核心。
"在不同的适用场景下,小模型的决策速度可以更快。"徐立说道,"云端联动可以得到最佳推理效果。我们的数据显示,端侧在处理部分场景的占比超过70%时,推理的成本更低。"
事实上,大模型向"轻量化"方向发展已经成为业内的一个趋势。4月23日,微软也推出轻量级人工智能模型Phi-3-mini,希望通过提供具有成本效益的选项来吸引更广泛的客户群。
微软表示,Phi-3-mini是该公司发布的三种小语言模型(SLM)中的首个。SLM旨在执行更简单的任务,使资源有限的公司更容易使用。微软生成式AI研究副总裁Sébastien Bubeck表示:"Phi-3的价格与具有类似功能的其他模型版本相比,仅为十分之一。"
Phi-3-mini也在微软云服务平台Azure、机器学习模型平台Hugging Face以及英伟达的软件工具NIM上可用。
在商汤的发布会上,该公司还首次推出面向金融、代码、医疗、政务等多个领域的边缘产品"商汤企业级大模型一体机",可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,降低企业应用大模型的门槛。
商汤在发布会上公布了这台大模型一体机的售价,每台售价35万元人民币起,单台机器可支持100人规模研发团队使用,使用成本最低为每人每天4.5元。该公司称,相比行业同类产品,使用该设备推理成本可节约80%。
团队在人工智能(AI)热辐射超材料领域取得重大原创突破,构建了一个热辐射超材料逆向设计AI模型
上海正围绕制造、医疗、科学等5+6重点行业全面实施“模塑申城”工程
他认为,越接近通用智能越要保持敏捷治理,形成创造技术与社会良性互动,否则带来的危害也可能是颠覆性的。
Meta在这场激烈的AI竞争中全力以赴,该公司已经宣布斥资100亿美元在美国路易斯安那州一处农田上建设西半球最大的数据中心,该地块面积相当于1700个足球场。
以及80余款“全球首发”或“中国首秀”的重磅新品,规模创历届之最。