打开微信,点击底部的“发现”,使用“扫一扫”即可将网页分享至朋友圈。
第一财经 2025-09-12 10:34:46
责编:殷晴妍
据小米技术官微消息,近日,小米集团AI实验室新一代 Kaldi 团队发布了基于 Flow Matching 架构的ZipVoice系列语音合成(TTS)模型——ZipVoice(零样本单说话人语音合成模型)[1] 与ZipVoice-Dialog(零样本对话语音合成模型)。ZipVoice解决了现有零样本语音合成模型的参数量大、合成速度慢的痛点。ZipVoice-Dialog 则解决了现有对话语音合成模型在稳定性和推理速度上的瓶颈。
马斯克表示,xAI将于2026年底前发布一款AI生成游戏。
港股小米集团涨幅扩大至5%
该大模型采用端到端多模态架构,将语音理解、音频推理与生成统一建模。
大模型走出实验室。