
{{aisd}}
AI生成 免责声明
美国人工智能研究公司OpenAI近日宣布,即日起开始向部分ChatGPT Plus用户推出GPT-4o的语音模式。这一高级语音模式能够提供更为自然的实时对话,用户可以随时打断对话,而GPT-4能够感知并响应用户的情绪。这一功能的推出,意味着OpenAI在语音助手技术上的又一重要突破,特别是实时响应和可打断对话这两大公认的技术难点。
OpenAI在今年5月份推出了新版本的大模型GPT-4o,并同时展示了其语音模式。最初计划于6月底逐步向用户开放语音模式,但最终决定推迟至7月份发布。根据OpenAI的计划,语音模式将在今年秋季向所有ChatGPT Plus用户开放。
目前,GPT-4o的语音模式提供了四种预设声音,分别是Juniper、Breeze、Cove和Ember。这些声音是由OpenAI与付费配音演员合作制作的。
腾讯混元提出HY-WU,让模型实时生成参数“换脑”;大晓机器人开源以空间智能为基的通用技术底座。
OpenAI试图通过GPT-5.4的涨价向资本市场证明商业化能力。
同样的安全红线,有人决裂,有人签单。
OpenAI推进新一轮巨额融资;阿里千问宣布推出Qwen Coding Plan。
知情人士表示,OpenAI计划将相当比例的新资金投入算力相关硬件采购,包括来自英伟达的芯片产品,用于数据中心和基础设施建设。