分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

Kimi杨植麟称“训练成本很难量化”，仍将坚持开源策略

第一财经 2025-11-11 18:34:26 听新闻

作者：吕倩责编：宁佳彦

每一张算力卡都被用到了极致。

来源：Reddit

北京时间11月11日，人工智能初创公司月之暗面Kimi CEO杨植麟等人在社交平台Reddit上解答网友提问，回应关于模型训练成本等问题。

Kimi近半年时间持续投入开源模型的研发与更新。11月6日发布了最新版本的开源思考模型Kimi K2 Thinking。彼时有消息称，Kimi K2 Thinking的训练成本为460万美元，低于DeepSeek V3模型的560万美元和OpenAI GPT-3的数十亿美元。

针对该数据，杨植麟在此次对话中回应称：（460万美元）不是官方数字，由于大部分投入都花在研究与实验上，因此训练成本很难量化。

网友也提出Kimi K2 Thinking推理长度过长、榜单成绩与实际体验不符等质疑，杨植麟表示现阶段该模型优先考虑绝对性能，token效率会在后续得到改善，榜单高分与实测的脱节问题也会在模型通用能力得到补齐后被逐渐消解。

当下，越来越多的中国开源大模型在国际市场中被调用。记者搜索OpenRouter模型调用榜单，最新一周内，排名前二十名的模型产品中，中国开源模型产品占五席，具体包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp。Kimi因OpenRouter平台接口问题，目前只能以API形式被使用。

持续的模型更新与庞大训练量需要算力资源支持，Kimi团队表示所使用的芯片是携带InfiniBand（一种面向高性能计算和AI训练的网络互连技术）的H800 GPU，性能虽然比不上美国的高端卡，数量也处于劣势，但每张卡都被用到了极致。

来源：OpenRouter