7月3日,摩尔线程发布其夸娥万卡智算集群。人工智能,尤其是大模型的发展,激发了新的投资热潮。地方政府、大型科技企业等都有建立智算中心的动力。在这些智算中心,GPU发挥关键作用。摩尔线程是国内明星初创企业之一,其核心产品是GPU。大模型参数越来越多,对算力的需求越来越高。摩尔线程的CEO张建中表示,在AI的主战场上,万卡集群将是标配。万卡集群是超级复杂的系统工程,挑战在于超大规模的组网互联、集群有效计算效率,以及训练的高稳定性等。
张建中表示,夸娥万卡集群的有效计算效率60%以上,平均无故障运行时间15天。大模型用户可以通过编译器等方式从英伟达CUDA体系实现迁移。当天,摩尔线程联合青海移动、青海联通、德道信科、中国能建、桂林华崛分别就三个万卡集群项目进行了战略签约。
该集群建设了超大规模的高性能网络,能够保证大规模集群执行训练任务时的稳定性,创新性地设计了显著降低能耗的散热方案。
自上周开始,GPU、CPU的价格波动就比较大。
OpenAI创始人Sam Altman:将在几周内发布o3、o4-MINI;谷歌宣布一个新的实验性人工智能模型Sec-Gemini V1。
当加密货币价格暴跌时,他们将公司更名为CoreWeave,筹集资金从陷入困境的“矿工”那里购买尽可能多的GPU芯片,并打赌他们可以在加密货币挖矿变得无利可图时重新利用这些芯片。
百度即将上线三万卡的自研国产芯片昆仑芯集群,同时还在继续迭代模型。