首页 > 新闻 > 投研信息

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

亿铸科技熊大鹏:大模型真正的壁垒在存储墙

第一财经 2023-11-27 16:51:32 听新闻

作者:冯丽君    责编:黄宇

存算一体能够解决存储墙瓶颈,被认为是后摩尔时代的必然选择。

AI(人工智能)大模型参数呈现指数型增长,海量算力需求迸发。面对紧缺的算力,作为先进算力的代表技术,存算一体,包括以存算一体为基础的各种解决方案和新技术被广为看好。

存算一体,即数据存储与计算融合在同一个芯片的同一片区之中,极其适用于大数据量、大规模并行的应用场景。存算一体最显著的特征是能够解决存储墙瓶颈。

由于数据需要在计算单元和存储单元频繁移动,存储墙是算力提升的首要限制因素之一。同时,在过去二十年,处理器性能以每年大约55%的速度提升,内存性能的提升速度每年仅约10%。因此,目前的存储速度严重滞后于处理器的计算速度。

能耗方面,从处理单元外的存储器提取(数据)所需的时间往往是运算时间的成百上千倍。

成本方面,亿铸科技创始人、董事长兼CEO熊大鹏在2023年11月23日举办的第三届中国临港国际半导体大会上表示,“对于部署端来说,即使像微软这样的公司,也感觉到部署一个用户体验较好的系统所需投资非常大。系统建起来之后的运营成本也非常高。我们做过一个初步的估算,如果是1亿人同时在线,大概需要3000亿-5000亿美元,每一年光是电费就将近100亿美元。”

在后摩尔时代,依靠“卷”制程来提高芯片的性能,效果已然不够显著,难度和成本也非常大。存算一体能够通过节省数据传输时间达到提升性能的效果。华西证券认为,存算一体将是后摩尔时代的必然选择。

“对于大模型来说,我们认为它真正的壁垒不在摩尔定律,而在存储墙。”熊大鹏举例称,“H200和H100在算力上提升得并不多,主要是(数据)从HBM(高带宽内存)往芯片里转的带宽做得更好,导致实际有效算力能够提升60%、70%,甚至在某些情况差不多翻一倍,主要原因是存储墙所导致的。”

“AI大模型运行过程中,数据搬运所占用的时间超过95%、98%,这意味着计算的核堆得再多,如果数据从外面的HBM传不进来,能提升的计算效率也只有5%、10%。而解决数据带宽的问题,不仅投资没有那么大,得到的实际计算效率也会高很多。”熊大鹏称。

目前,国产存算一体芯片企业包括千芯科技、智芯微、亿铸科技、后摩时代、苹芯科技等。

举报

文章作者

一财最热
点击关闭