OpenAI CTO米拉·穆拉蒂近日在接受采访时,对Sora的训练数据语焉不详,让Sora及OpenAI陷入巨大的版权争议。
在被问及“Sora是用什么数据训练的”时,穆拉蒂思考几秒之后给了一个十分官方的回答:“我们使用的是公开可用的数据,以及经过许可的数据。”记者又问“所以是用了YouTube上的视频吗”,听到这个问题后,穆拉蒂显得格外迟疑,她犹豫了几秒后称:“关于这个情况,我不太确定。”
随后,记者再次追问是否使用了Facebook、Instagram以及Shutterstock上的视频,穆拉蒂仍称不太确定,并表示不会详细透露关于使用数据的细节,但强调该公司使用的是公开可用的以及经过许可的数据。
事实上,训练AI模型面临的巨大版权争议是一年多来相关人士讨论最多的话题。此前,OpenAI已频繁陷入版权纠纷,包括作家和《纽约时报》提起的多个诉讼。
OpenAI又要吃官司?CTO采访“翻车” Sora训练数据遭质疑。点击视频,一看究竟!