
{{aisd}}
AI生成 免责声明
据36氪,2月11日,蚂蚁集团开源发布全模态大模型Ming-flash-omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越Gemini 2.5 Pro。Ming-flash-omni 2.0也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。
OpenAI宣布推出依托Sora 2的视频社交应用,用户可通过文本提示生成带音频的高清短片,并与他人互动。
但AI生成还有不少进步空间
①OpenAI据悉正在打造类似X的社交网络;②抖音公开算法原理;③谷歌已将Veo 2视频生成模型全面整合至Gemini。
DeepSeek V3模型完成小版本升级
2025年AI大模型降价潮或将持续,大模型概念股获杠杆资金抢筹