9月19日,首款全栈国产化深度推理大模型“紫东太初”4.0在武汉发布,具备“边看、边识、边思”的类人多模态推理认知能力,特别是在带图思考多模态复杂推理和工具调用的能力上,全面超过了GPT5。
2024年图灵奖得主理查德·萨顿表示,人类数据正在迅速接近极限,智能体将越来越多通过与世界交互而获得持续学习的能力,潜力远超以往。
中国科学院自动化研究所副总工程师、武汉人工智能研究院院长王金桥在接受第一财经记者采访时介绍,从3.0原生的多模态统一框架到4.0多模态细腻度的复杂思考,紫东太初完成了国产大模型从“纯文本思考”“简单操作带图思考”到“细粒度多模态语义思考”的三重跃迁。
以推理“赢得一场斯洛克需要几步”为例,“紫东太初”4.0通过输入的图片可先定位白球、粉球和红球的位置,再通过台上不同球的得分进行复杂的推理和数学计算,进一步告诉大家他要做5杆斯洛克才能赢得这场球。
“紫东太初4.0从理解能力、模态推理、动态推理三大能力引入了类人的交叉注意力机制,使大模型能够像人一样,实现对世界的理解从全局到局部再到上下文交互式的思考过程。”王金桥说,通过视觉注意力关注到某一个区域,然后进行平移、放大、旋转、增强等一系列操作来模仿人类对世界探索的过程,使得模型从被动分析迈入到主动思考的新阶段。
在视频多模态2AG应用上,“紫东太初”4.0能够实现180分钟长视频的深度理解,细腻度片段定位和内容自动分析、总结,在视频问答、细腻度检索和文档检索等6项任务中达到SOTA(State-of-the-art的简称,常用于衡量大模型性能的基准)的性能。
王金桥表示,在多模态推理、逻辑思维和智能体上,“紫东太初”4.0全面对标了GPT4.1nano和GPT4O等先进模型,在带图思考多模态复杂推理和工具调用上,则全面超过了GPT5。
不仅仅是QA问答智能体升级,紫东太初4.0将以更高性能赋能实体经济,包括工业智能、具身智能、医疗智能等。王金桥向第一财经记者介绍,以紫东太初与华工科技合作的高精度激光焊接技术为例,相比3.0版本,紫东太初4.0具备更强的空间交互能力,推理速度约可提升15%左右。这就意味着,华工科技当前每43秒完成一辆新能源汽车车身的激光焊接速度,有望再次实现提升。
除此之外,“紫东太初”4.0还具有三大核心技术创新。王金桥进一步表示,一是低成本、高覆盖的真实事件多决策的数据合成和增强,保证了训练效果。二是批判式的多轮反思学习,知可行也知不可行,遇到困难的时候可以退回来换一条路,不断尝试来解决问题。三是难度敏感的自适应强化学习,通过从简单体再到复杂体再到困难体,层级渐进式训练保证训练效率和模型的稳定性。同时这三大技术能力保证了训练的效率和推理性能的显著提升,相较“紫东太初”3.0,整体提升了15%左右。
为推动紫东太初4.0的技术优势转化为实际产业价值,“紫东太初云”平台亦同步发布。武汉人工智能研究院副院长张家俊表示,紫东太初云是国内首个多模态大模型原生协同云,也是首个全栈国产化万卡智算云。涵盖算力服务、大模型训推、应用开发、具身智能四大核心板块,面向企业提供从算力支撑、平台服务到应用落地的全链路能力。上线后,该平台将运用全栈AI能力深入赋能企业核心业务,立足湖北优势产业打造一批标杆案例,与合作伙伴共同推动大模型能力转化为产业动能,为我国现代画产业体系智能化转型贡献力量。
发布现场,武汉人工智能研究院与四川并济科技有限公司等5家企业共同启动“十万卡多模态大模型异构智能训练平台”,为大模型技术加速迭代升级提供技术支持。
全国政协委员、中国科学院计算技术研究所研究员张云泉表示,中国当前已进入算力经济时代,算力与数据、算法共同构成数字经济时代的关键资源,其经济拉动效应显著,要推动人工智能技术快速迭代与广泛应用。
以创新为主线和以安全为底线、统筹创新与竞争、兼顾效率与公平优化人工智能大模型市场竞争路径。
他们可能成功,也可能一败涂地,但时代已不允许苟且。
进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家面临被时代边缘化的风险。
段涛认为,并非医院部署了大模型之后,一夜之间就可以改变很多东西。AI改变医疗行业,还有很长的路要走。
由于缺乏常规且经济有效的筛查测试,许多有结构性心脏问题的人直到心脏功能严重受损时才被发现。