北京时间2月16日,OpenAI重磅发布视频大模型Sora,它能够仅仅根据提示词就生成60s的连贯视频,再次震撼了整个科技圈。
为展示新模型的强大之处,OpenAI在官网一连发布了多个展示视频。视频中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,无论是画面、景深还是运镜,甚至是人物微表情、动物神态都已经足够精彩逼真。
如“维多利亚冠鸽的特写照片”让人直呼细节拉满;行驶中的列车窗外偶遇遮挡,车内人物倒影短暂出现非常惊艳;“中国新年庆祝视频”中,红旗招展人山人海,有好奇观望舞龙队伍的儿童,也有掏出手机边走边拍的成人。
与此同时,OpenAI也指出Sora可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系,如在一些复杂场景中,会有物体凭空出现或消失的情况。但毫无疑问,Sora的出现预示着一个全新视觉叙事时代的到来。
文字直接变视频!OpenAI又放大招 视频大模型Sora隆重登场。点击视频,一看究竟!
万众瞩目的视频生成模型Sora在2024年底正式向用户开放,而随着近一年来DiT技术的井喷式爆发,大批优秀的视频模型平台也在过去一年纷纷涌现。从物理规律、语义正确、场景一致等多个维度,各视频生成平台使用起来表现如何?业内人士表示,当前视频模型的性能表现各有千秋,而国产模型则已经在过去近一年的时间里追平了与全球顶级产品的代际差。AI视频生成行业当前处于怎样的发展阶段?未来又将面临怎样的问题和挑战?