
{{aisd}}
AI生成 免责声明
近日,谷歌研究发布关于TurboQuant(一种键值缓存压缩方案)的技术方案,宣称可将大语言模型推理阶段的长文本键值缓存需求减少6倍,并在英伟达H100 GPU上实现高达8倍推理速度提升,且几乎不损失模型精度。受此影响,市场担忧AI对存储硬件的需求将被大幅削弱,美股存储相关公司股价遭遇重挫。
“壹评级”认为,市场显著误读了TurboQuant。该算法仅优化推理过程中的键值缓存,不影响模型训练阶段的存储需求。其本质是提升单GPU的吞吐效率,使现有的硬件能处理更长上下文或服务更多用户,而非直接减少存储硬件的总采购量。
“壹评级”强调,市场应引入“杰文斯悖论”审视这一技术变革。该理论指出,效率提升会降低单位成本,反而激发更广泛的应用需求,最终推高资源的总消耗。在AI领域,TurboQuant通过降低每Token(词元)的推理成本,使得复杂、长文本的AI应用更易部署,催生出大量此前因成本受限而无法落地的新场景。因此,长期来看,效率革命将推动AI应用的生态扩张,成为硬件需求的增长引擎。
综上所述,“壹评级”认为,存储板块的调整源于市场情绪过度反应,而非产业基本面出现转折。AI驱动存储的核心逻辑并未改变,算法突破长期利好硬件需求。建议逢低布局兆易创新、江波龙、雅克科技等存储产业链核心标的。