打开微信,点击底部的“发现”,使用“扫一扫”即可将网页分享至朋友圈。
第一财经 2025-08-12 14:55:49
责编:张骁
据证券时报,8月12日,华为正式发布AI推理创新技术UCM(推理记忆数据管理器)。据了解,作为一款以KV Cache为中心的推理加速套件,UCM融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每Token推理成本。该技术已率先在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中,开展智慧金融AI推理加速应用试点,并已取得成果。
高增长AI应用概念股揭晓
黄仁勋称AI推理需要更多计算量
超跌DeepSeek概念股曝光
报告显示此前 R1模型幻觉率在21%左右。
2024年中国数据中心加速卡市场中,34.6%是国产算力,市场研究机构预计今年上半年国产算力占比应该会超四成。