当地时间5月14日,OpenAI发布最新多模态大模型GPT-4o。OpenAI首席技术官穆拉蒂 (Muri Murati) 介绍称,该模型运行速度更快,并具备更强的文本、图像以及语音处理能力,将免费向所有用户开放。OpenAI还表示,未来将允许用户与ChatGPT进行视频聊天。
硅谷连续创业者、Traini创始人及CEO孙邻家在接受第一财经记者采访时表示,OpenAI的最新发布将交互方式进行了升级、变革。“语音正在成为一个较稳定的接口,扩宽人类与产品交互的物理边界。而且与GPT实时对话时,GPT能富有情感地回应,这个很酷,之前AGI是缺乏情感的。”他还表示,人工智能(AI)领域正在往AI应用方向发展,将给生活创造真实价值。
万众瞩目的视频生成模型Sora在2024年底正式向用户开放,而随着近一年来DiT技术的井喷式爆发,大批优秀的视频模型平台也在过去一年纷纷涌现。从物理规律、语义正确、场景一致等多个维度,各视频生成平台使用起来表现如何?业内人士表示,当前视频模型的性能表现各有千秋,而国产模型则已经在过去近一年的时间里追平了与全球顶级产品的代际差。AI视频生成行业当前处于怎样的发展阶段?未来又将面临怎样的问题和挑战?