AI(人工智能)大模型参数呈现指数型增长,海量算力需求迸发。面对紧缺的算力,作为先进算力的代表技术,存算一体,包括以存算一体为基础的各种解决方案和新技术被广为看好。
存算一体,即数据存储与计算融合在同一个芯片的同一片区之中,极其适用于大数据量、大规模并行的应用场景。存算一体最显著的特征是能够解决存储墙瓶颈。
由于数据需要在计算单元和存储单元频繁移动,存储墙是算力提升的首要限制因素之一。同时,在过去二十年,处理器性能以每年大约55%的速度提升,内存性能的提升速度每年仅约10%。因此,目前的存储速度严重滞后于处理器的计算速度。
能耗方面,从处理单元外的存储器提取(数据)所需的时间往往是运算时间的成百上千倍。
成本方面,亿铸科技创始人、董事长兼CEO熊大鹏在2023年11月23日举办的第三届中国临港国际半导体大会上表示,“对于部署端来说,即使像微软这样的公司,也感觉到部署一个用户体验较好的系统所需投资非常大。系统建起来之后的运营成本也非常高。我们做过一个初步的估算,如果是1亿人同时在线,大概需要3000亿-5000亿美元,每一年光是电费就将近100亿美元。”
在后摩尔时代,依靠“卷”制程来提高芯片的性能,效果已然不够显著,难度和成本也非常大。存算一体能够通过节省数据传输时间达到提升性能的效果。华西证券认为,存算一体将是后摩尔时代的必然选择。
“对于大模型来说,我们认为它真正的壁垒不在摩尔定律,而在存储墙。”熊大鹏举例称,“H200和H100在算力上提升得并不多,主要是(数据)从HBM(高带宽内存)往芯片里转的带宽做得更好,导致实际有效算力能够提升60%、70%,甚至在某些情况差不多翻一倍,主要原因是存储墙所导致的。”
“AI大模型运行过程中,数据搬运所占用的时间超过95%、98%,这意味着计算的核堆得再多,如果数据从外面的HBM传不进来,能提升的计算效率也只有5%、10%。而解决数据带宽的问题,不仅投资没有那么大,得到的实际计算效率也会高很多。”熊大鹏称。
目前,国产存算一体芯片企业包括千芯科技、智芯微、亿铸科技、后摩时代、苹芯科技等。