分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

紫东太初4.0发布，国产大模型迈向“边看、边识、边思”新阶段

第一财经 2025-09-19 19:17:54 听新闻

作者：周芳责编：计亚

为推动紫东太初4.0的技术优势转化为实际产业价值，“紫东太初云”平台同步发布。

9月19日，首款全栈国产化深度推理大模型“紫东太初”4.0在武汉发布，具备“边看、边识、边思”的类人多模态推理认知能力，特别是在带图思考多模态复杂推理和工具调用的能力上，全面超过了GPT5。

2024年图灵奖得主理查德·萨顿表示，人类数据正在迅速接近极限，智能体将越来越多通过与世界交互而获得持续学习的能力，潜力远超以往。

中国科学院自动化研究所副总工程师、武汉人工智能研究院院长王金桥在接受第一财经记者采访时介绍，从3.0原生的多模态统一框架到4.0多模态细腻度的复杂思考，紫东太初完成了国产大模型从“纯文本思考”“简单操作带图思考”到“细粒度多模态语义思考”的三重跃迁。

以推理“赢得一场斯洛克需要几步”为例，“紫东太初”4.0通过输入的图片可先定位白球、粉球和红球的位置，再通过台上不同球的得分进行复杂的推理和数学计算，进一步告诉大家他要做5杆斯洛克才能赢得这场球。

“紫东太初4.0从理解能力、模态推理、动态推理三大能力引入了类人的交叉注意力机制，使大模型能够像人一样，实现对世界的理解从全局到局部再到上下文交互式的思考过程。”王金桥说，通过视觉注意力关注到某一个区域，然后进行平移、放大、旋转、增强等一系列操作来模仿人类对世界探索的过程，使得模型从被动分析迈入到主动思考的新阶段。

在视频多模态2AG应用上，“紫东太初”4.0能够实现180分钟长视频的深度理解，细腻度片段定位和内容自动分析、总结，在视频问答、细腻度检索和文档检索等6项任务中达到SOTA（State-of-the-art的简称，常用于衡量大模型性能的基准）的性能。

王金桥表示，在多模态推理、逻辑思维和智能体上，“紫东太初”4.0全面对标了GPT4.1nano和GPT4O等先进模型，在带图思考多模态复杂推理和工具调用上，则全面超过了GPT5。

不仅仅是QA问答智能体升级，紫东太初4.0将以更高性能赋能实体经济，包括工业智能、具身智能、医疗智能等。王金桥向第一财经记者介绍，以紫东太初与华工科技合作的高精度激光焊接技术为例，相比3.0版本，紫东太初4.0具备更强的空间交互能力，推理速度约可提升15%左右。这就意味着，华工科技当前每43秒完成一辆新能源汽车车身的激光焊接速度，有望再次实现提升。

除此之外，“紫东太初”4.0还具有三大核心技术创新。王金桥进一步表示，一是低成本、高覆盖的真实事件多决策的数据合成和增强，保证了训练效果。二是批判式的多轮反思学习，知可行也知不可行，遇到困难的时候可以退回来换一条路，不断尝试来解决问题。三是难度敏感的自适应强化学习，通过从简单体再到复杂体再到困难体，层级渐进式训练保证训练效率和模型的稳定性。同时这三大技术能力保证了训练的效率和推理性能的显著提升，相较“紫东太初”3.0，整体提升了15%左右。

为推动紫东太初4.0的技术优势转化为实际产业价值，“紫东太初云”平台亦同步发布。武汉人工智能研究院副院长张家俊表示，紫东太初云是国内首个多模态大模型原生协同云，也是首个全栈国产化万卡智算云。涵盖算力服务、大模型训推、应用开发、具身智能四大核心板块，面向企业提供从算力支撑、平台服务到应用落地的全链路能力。上线后，该平台将运用全栈AI能力深入赋能企业核心业务，立足湖北优势产业打造一批标杆案例，与合作伙伴共同推动大模型能力转化为产业动能，为我国现代画产业体系智能化转型贡献力量。

发布现场，武汉人工智能研究院与四川并济科技有限公司等5家企业共同启动“十万卡多模态大模型异构智能训练平台”，为大模型技术加速迭代升级提供技术支持。

全国政协委员、中国科学院计算技术研究所研究员张云泉表示，中国当前已进入算力经济时代，算力与数据、算法共同构成数字经济时代的关键资源，其经济拉动效应显著，要推动人工智能技术快速迭代与广泛应用。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部：banquan@yicai.com