首页 > 新闻 > 科技

分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

102分！AI首战中学奥赛拿下金牌，离超越人类已经不远？

第一财经 2025-12-12 20:49:29 听新闻

作者：刘晓洁责编：刘佳

“AI在奥赛中超越人类是未来一定会发生的事。”

在刚刚落幕的2025年全国中学生数学奥林匹克竞赛（CMO）决赛中，除了涌现出一批数学天赋出众的年轻选手，还有一个特殊的“考生”引人注目——AI大模型。

CMO是中国最高规格的数学奥林匹克竞赛，今年，主办方首次设立AI测试环节，邀请大模型与人类同场答题，并交由相同的评委专家组阅卷打分。上海人工智能实验室旗下的书生科学多模态大模型（Intern-S1-20251122）拿到102分。

据公开信息，今年CMO考生前三名得分分别为126（满分）、110分、102分，Intern-S1取得的成绩位列总分榜第三，在AI中排名第一。

本届CMO共有700余名选手参赛，223人获得金牌，前60名选手获得清华北大保送资格并入选国家集训队。AI目前虽未超越人类选手最高分，但其表现已远超大多数参赛者，甚至超过了许多金牌得主，本次金牌线为78分。

“AI在奥赛中超越人类是未来一定会发生的事。”上海人工智能实验室青年领军科学家陈恺对第一财经表示。他认为，正如AlphaGo最终战胜世界围棋冠军，AI在数学竞赛上的进步也是一个逐步发展的过程。现在AI已经能拿奥赛金牌了，未来超过奥赛顶尖的人类选手也大有可能。

“数学是推理能力的代表性领域，也是目前很多大模型团队重点投入优化的方向之一，因此进展相对更快。”不过，陈恺强调，奥赛只是数学里的一个任务，因此AI在奥赛中超过人类，并不意味着AI在数学或更广泛的能力上就能超过人。

“数学是个很宽泛深奥的领域，也有很多前沿的研究，在这方面AI还要更长的时间积累。”陈恺补充道。

中国人民大学附属中学教师、奥数金牌教练张端阳也是AI训练的“顾问”，在接触之初他对大模型的印象还停留在只能解答数学高考题的水平，大模型在CMO的表现，也让他惊讶于AI发展的速度之快，“就像 10 年前的围棋一样，突破可能就是一刹那。”

上海人工智能实验室发布的文章提到，此次Intern-S1 推理能力的提升得益于“通专融合”技术架构 SAGE（中文含义为智者），创新点在于以数学引理为核心的多轮分层推理机制，以及基于结果的过程校验模型，显著提升了模型在超长程思考和证明时的严谨，还有通用模型结合专业符号引擎，让通用模型掌握像人类科学家一样逐步推导、探索和修正的思路。

AI在数学和推理领域的突破意味着什么？陈恺认为，这对教育和科研领域的落地都会很有帮助，此外，数学能力也是复杂推理等各种能力的基础，因此这一能力的提升和演进能进一步帮助大模型提升智力水平。

让大模型辅助教育学习是已经在落地的方向之一，AI可以给出解答和思考过程。而AI在奥数能够拿金牌、达到人类第三的水平，就意味着在高中数学或者K12教育领域，AI的辅导能力更强了。此外，在科研方面，陈恺提到，有一些数学家已经在用大模型在其科研过程中帮助做一些定理证明、开阔思路。

对于这次Intern-S1的答卷，有阅卷专家认为，AI对第四题的解答是“一个新的解法，巧妙的调整法，在学生的解法中没有见过”。这意味着AI能突破人类解题思路局限，通过自主探索和分析找到新的解题方法，这对赋能科学发现有很大的意义。

上海人工智能实验室在官方发文中表示，计划将 Intern-S1 的长程推理能力拓展应用于物理、化学、生命科学等基础科研领域，通过与专业工具的打通与融合，实现从“长时间独立思考”向“长时间独立科研”转变，进而加速各领域科研范式的变革，为科学突破提供支撑。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部：banquan@yicai.com