首页 > 新闻 > 资讯

分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

蚂蚁集团开源全模态大模型Ming-flash-omni 2.0

第一财经 2026-02-11 12:09:09

责编：高明妍

蚂蚁集团开源全模态大模型Ming-flash-omni 2.0

据36氪，2月11日，蚂蚁集团开源发布全模态大模型Ming-flash-omni 2.0。在多项公开基准测试中，该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出，部分指标超越Gemini 2.5 Pro。Ming-flash-omni 2.0也是业界首个全场景音频统一生成模型，可在同一条音轨中同时生成语音、环境音效与音乐。

举报

相关阅读

国家互联网信息办公室发布第十六批深度合成服务算法备案信息

国家互联网信息办公室发布第十六批深度合成服务算法备案信息

Seedance2.0生成视频价格公布

Seedance2.0生成视频价格公布

Sora模型重磅升级，OpenAI挑战AI视频社交赛道

OpenAI宣布推出依托Sora 2的视频社交应用，用户可通过文本提示生成带音频的高清短片，并与他人互动。

594 2025-10-01 07:19

好莱坞特效师花300多块钱，用AI做了一部科幻短片

但AI生成还有不少进步空间

6 483 2025-08-21 20:17

AI进化速递 | OpenAI据悉正在打造类似X的社交网络

①OpenAI据悉正在打造类似X的社交网络；②抖音公开算法原理；③谷歌已将Veo 2视频生成模型全面整合至Gemini。

106 2025-04-16 20:42

一财最热