打开微信,点击底部的“发现”,使用“扫一扫”即可将网页分享至朋友圈。
第一财经 2026-02-12 11:53:41
责编:高明妍
{{aisd}}
AI生成 免责声明
2月12日,面壁智能正式发布行业首个大规模训练的稀疏-线性注意力混合架构SALA,以及基于该架构的文本模型MiniCPM-SALA,模型仅有9B参数。据介绍,MiniCPM-SALA不使用投机采样等加速算法,在云端推理芯片上,当序列长度为256K词元时推理速度高达Qwen3-8B的3.5倍,并支持在云端芯片和消费级端侧GPU上进行高达一百万词元上下文长度的推理。
国产算力正处于一个非常有利的位置。
“突破开源大模型边界”。
黄仁勋称AI推理需要更多计算量
报告显示此前 R1模型幻觉率在21%左右。
2024年中国数据中心加速卡市场中,34.6%是国产算力,市场研究机构预计今年上半年国产算力占比应该会超四成。