OpenAI CTO米拉·穆拉蒂近日在接受采访时,对Sora的训练数据语焉不详,让Sora及OpenAI陷入巨大的版权争议。
在被问及“Sora是用什么数据训练的”时,穆拉蒂思考几秒之后给了一个十分官方的回答:“我们使用的是公开可用的数据,以及经过许可的数据。”记者又问“所以是用了YouTube上的视频吗”,听到这个问题后,穆拉蒂显得格外迟疑,她犹豫了几秒后称:“关于这个情况,我不太确定。”
随后,记者再次追问是否使用了Facebook、Instagram以及Shutterstock上的视频,穆拉蒂仍称不太确定,并表示不会详细透露关于使用数据的细节,但强调该公司使用的是公开可用的以及经过许可的数据。
事实上,训练AI模型面临的巨大版权争议是一年多来相关人士讨论最多的话题。此前,OpenAI已频繁陷入版权纠纷,包括作家和《纽约时报》提起的多个诉讼。
OpenAI又要吃官司?CTO采访“翻车” Sora训练数据遭质疑。点击视频,一看究竟!
万众瞩目的视频生成模型Sora在2024年底正式向用户开放,而随着近一年来DiT技术的井喷式爆发,大批优秀的视频模型平台也在过去一年纷纷涌现。从物理规律、语义正确、场景一致等多个维度,各视频生成平台使用起来表现如何?业内人士表示,当前视频模型的性能表现各有千秋,而国产模型则已经在过去近一年的时间里追平了与全球顶级产品的代际差。AI视频生成行业当前处于怎样的发展阶段?未来又将面临怎样的问题和挑战?