首页 > 新闻 > 区域

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

紫东太初4.0发布,国产大模型迈向“边看、边识、边思”新阶段

第一财经 2025-09-19 19:17:54 听新闻

作者:周芳    责编:计亚

为推动紫东太初4.0的技术优势转化为实际产业价值,“紫东太初云”平台同步发布。

9月19日,首款全栈国产化深度推理大模型“紫东太初”4.0在武汉发布,具备“边看、边识、边思”的类人多模态推理认知能力,特别是在带图思考多模态复杂推理和工具调用的能力上,全面超过了GPT5。

2024年图灵奖得主理查德·萨顿表示,人类数据正在迅速接近极限,智能体将越来越多通过与世界交互而获得持续学习的能力,潜力远超以往。

中国科学院自动化研究所副总工程师、武汉人工智能研究院院长王金桥在接受第一财经记者采访时介绍,从3.0原生的多模态统一框架到4.0多模态细腻度的复杂思考,紫东太初完成了国产大模型从“纯文本思考”“简单操作带图思考”到“细粒度多模态语义思考”的三重跃迁。

以推理“赢得一场斯洛克需要几步”为例,“紫东太初”4.0通过输入的图片可先定位白球、粉球和红球的位置,再通过台上不同球的得分进行复杂的推理和数学计算,进一步告诉大家他要做5杆斯洛克才能赢得这场球。

“紫东太初4.0从理解能力、模态推理、动态推理三大能力引入了类人的交叉注意力机制,使大模型能够像人一样,实现对世界的理解从全局到局部再到上下文交互式的思考过程。”王金桥说,通过视觉注意力关注到某一个区域,然后进行平移、放大、旋转、增强等一系列操作来模仿人类对世界探索的过程,使得模型从被动分析迈入到主动思考的新阶段。

在视频多模态2AG应用上,“紫东太初”4.0能够实现180分钟长视频的深度理解,细腻度片段定位和内容自动分析、总结,在视频问答、细腻度检索和文档检索等6项任务中达到SOTA(State-of-the-art的简称,常用于衡量大模型性能的基准)的性能。

王金桥表示,在多模态推理、逻辑思维和智能体上,“紫东太初”4.0全面对标了GPT4.1nano和GPT4O等先进模型,在带图思考多模态复杂推理和工具调用上,则全面超过了GPT5。

不仅仅是QA问答智能体升级,紫东太初4.0将以更高性能赋能实体经济,包括工业智能、具身智能、医疗智能等。王金桥向第一财经记者介绍,以紫东太初与华工科技合作的高精度激光焊接技术为例,相比3.0版本,紫东太初4.0具备更强的空间交互能力,推理速度约可提升15%左右。这就意味着,华工科技当前每43秒完成一辆新能源汽车车身的激光焊接速度,有望再次实现提升。

除此之外,“紫东太初”4.0还具有三大核心技术创新。王金桥进一步表示,一是低成本、高覆盖的真实事件多决策的数据合成和增强,保证了训练效果。二是批判式的多轮反思学习,知可行也知不可行,遇到困难的时候可以退回来换一条路,不断尝试来解决问题。三是难度敏感的自适应强化学习,通过从简单体再到复杂体再到困难体,层级渐进式训练保证训练效率和模型的稳定性。同时这三大技术能力保证了训练的效率和推理性能的显著提升,相较“紫东太初”3.0,整体提升了15%左右。

为推动紫东太初4.0的技术优势转化为实际产业价值,“紫东太初云”平台亦同步发布。武汉人工智能研究院副院长张家俊表示,紫东太初云是国内首个多模态大模型原生协同云,也是首个全栈国产化万卡智算云。涵盖算力服务、大模型训推、应用开发、具身智能四大核心板块,面向企业提供从算力支撑、平台服务到应用落地的全链路能力。上线后,该平台将运用全栈AI能力深入赋能企业核心业务,立足湖北优势产业打造一批标杆案例,与合作伙伴共同推动大模型能力转化为产业动能,为我国现代画产业体系智能化转型贡献力量。

发布现场,武汉人工智能研究院与四川并济科技有限公司等5家企业共同启动“十万卡多模态大模型异构智能训练平台”,为大模型技术加速迭代升级提供技术支持。

全国政协委员、中国科学院计算技术研究所研究员张云泉表示,中国当前已进入算力经济时代,算力与数据、算法共同构成数字经济时代的关键资源,其经济拉动效应显著,要推动人工智能技术快速迭代与广泛应用。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com

文章作者

一财最热
点击关闭