没有“存”,用什么“算”?
部分GPU虽理论性能强劲,但实际应用效果却未达预期,主要症结在于存储速度不足——GPU因等待存储数据而陷入闲置,不仅造成资源浪费,更制约了整体效率的提升。随着算力领域的发展节奏不断加快,市场对存力,也就是存储的需求也日益严苛。
近日,英韧科技创始人、董事长吴子宁表示,在新一代AI场景下,SSD将采用GPU直接调度方式,以超高吞吐量的极致性能构建新型存算架构,这为SSD应用带来更高的产品要求和趋势,通过GPU Direct等技术直接与显存通信,在数据中心内扩展HBM,在边缘侧提供确定性响应。存储介质细化为高速缓存层与大容量存储层,以分层化、高性能的新一代存储架构为算力突破提供坚实支撑。
英韧科技在企业级存储市场持续发力,提供面向AI应用的存储解决方案,这与海外公司的发展步调一致。今年6月,铠侠在投资人大会上推出“AI SDD”产品,基于国际头部GPU厂商英伟达需求打造;8月,三星、海力士相继推出超高速颗粒产品,匹配超高性能SSD,极高IOPS,应对人工智能GPU直接调度数据的技术趋势。
在数据中心,由GPU主导的典型应用包括用于KV Cache的GPU缓存和向量数据库,都要求高IOPS、低延时、QoS,这三个指标分别从 “处理效率”“响应速度”“服务稳定性” 三个维度定义存储能力;此外,像推理一体机、边缘推理、自动驾驶、具身机器人等需要高IOPS、低延时、长尾延时的场景也可以采用高性能的AI SSD扩展配合DDR快速响应。
吴子宁提到,构建AI SSD需要介质、架构、链接三大要素。其中,介质需要有低延时、高传输效率的特性,例如XL-Flash和SLC等;链接则需要更高速的接口和协议,例如PCIe Gen6/7以及CXL协议;而架构则需要简洁高效,能够充分协同介质和链接的迭代。
此前有业内人士对第一财经记者指出,当前上游存储颗粒国内企业在技术上取得突破,但高昂的研发成本与不足的回报率使得中下游发展受限。目前对国内的算力卡有相应的采购支持,但是对存力并没有要求,这也会影响下游如服务器厂商对国内SSD产品的购买热情。
能解决这一问题的唯一方式就是提升产品的竞争力。英韧科技最新发布的Dongting-N3X系列采用PCIe Gen5接口,搭配了恺侠新一代XL-Flash颗粒以及英韧优化的数据引擎,读写、延时可以满足当前应用对AI SSD的需求。吴子宁表示,英韧科技将持续迭代AI SSD产品,预计在2026年将推出PCIe Gen 6/CXL产品,达到10M IOPS;2027年,PCIe Gen 6/CXL产品IOPS将提升至25-50M IOPS;英韧科技未来的“X”系列产品将实现下一代NVMe和CXL双协议,并且融合多重AI生态,助力面向AI应用的解决方案达到100M IOPS。
阿里云算力投入将指数级提升。
OpenAI、甲骨文与软银宣布将在美国新建五个人工智能数据中心,未来三年投资额预计超过4000亿美元,总算力规模有望接近7吉瓦,最终目标扩展至10吉瓦。
英特尔CEO陈立武说,英伟达和英特尔的合作是一个重要里程碑,也是一个改变游戏规则的机会。
英特尔将为英伟达定制x86架构的CPU,英伟达将把相关产品集成到AI基础设施平台中。
“很多国产芯片在不断提升计算性能。”