首页 > 新闻 > 一财号

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

未来已来?--文生视频大模型Sora带来的影响与启示

第一财经 2024-02-27 13:32:27

作者:王鹏    责编:张健

2024年2月16日凌晨,全球知名的人工智能公司OpenAI发布了文生视频大模型Sora和数十个视频实例,并将其定义为“世界模拟器的视频生成模型”。Sora一经推出便在极短的时间内迅速引起了全球科技、产业、政府部门等各界的广泛关注与热议。

(本文作者王鹏为北京市社会科学院研究员,数据资产化研究院执行院长)

2024年2月16日凌晨,全球知名的人工智能公司OpenAI发布了文生视频大模型Sora和数十个视频实例,并将其定义为“世界模拟器的视频生成模型”。Sora一经推出便在极短的时间内迅速引起了全球科技、产业、政府部门等各界的广泛关注与热议。

一、Sora的核心技术与亮点:构建一种新现实

Sora的核心技术主要包括人工智能、大数据分析和云计算等。通过人工智能技术,Sora能够模拟人类的思维过程,实现对复杂问题的智能分析和解决。大数据分析技术则使得Sora能够处理海量数据,挖掘其中的价值,为决策提供有力支持。而云计算技术则为Sora提供了强大的计算能力和存储空间,保证了其高效稳定的运行。文生视频大模型Sora基于视频数据上对生成模型进行大规模训练的方法,可以根据给定的一段描述或一张静态图片,形成包含多个角色、不同类型的动作和背景细节的复杂场景,最终生成类似于电影的长达60秒的高清数字视频。与以往文本生成视频大模型相比,Sora具有以下几个显著特点:

(一)深入的理解能力

Sora能够准确解释提示并生成能表达丰富情感的角色,可以更好地理解用户的文本指令,并在生成的视频内容中忠实反映这些指令,使视频不仅保持视觉品质,也可以完整准确还原用户的提示语,还能够创造出生动的角色表情和复杂的运镜,使生成的视频具有高度的逼真性和叙事效果。

(二)强大的生成能力

Sora可以生成远超目前行业平均时长(4秒钟)的60秒的视频,也可以在单个生成的视频中创建多个镜头,并保持角色和视觉风格的一致性,还能够从现有的静态图像开始,准确地动画化图像内容,或者扩展现有视频,填补视频中的缺失帧。

(三)生动的互动能力

Sora可以理解真实世界场景并与之互动,在视频中既可以模拟物体移动和相互作用等真实物理世界的运动,也可以在高保真度渲染世界及其动态的同时够模拟人工过程,为未来开发高性能的物理和数字世界模拟器提供技术路线。

二、AI产业链的变革与机遇

尽管目前Sora仍存在模拟复杂场景交互不够精准、长时间样本不一致、部分模拟对象不受控、理解能力需要进一步强化等问题,但Sora所展现出的能力预示着视频模型持续扩展的巨大潜力,也会对技术、产业、社会治理产生重要影响:

(一)从技术创新角度看,人工智能大模型领域的竞争将进一步白热化,多模态大模型将成为生成式人工智能的重点,而文生视频将是多模态应用的主要研发方向。未来随着文生视频技术的日趋成熟和广泛应用,对于高端化、智能化算力、存储空间的需求将会持续增加,对于高价值训练数据集的需求也会激增。此外,经过长期的训练,Sora模型逐渐拥有了三维一致性,实现对物理世界的“涌现”。Sora对物理世界的理解和模拟成功,有可能会开辟大模型在物理、化学、数学基础学科研究上应用的先河,也会对机器人、自动驾驶、生物医药、基因工程等应用研究产生深刻影响。例如,在自动驾驶领域,Sora可以生成逼真的模拟视频,为无人驾驶汽车的视觉处理系统提供丰富多样的训练数据。这些模拟视频可以模拟不同的天气、光照条件、交通场景等,帮助提高系统的泛化能力。

(二)从产业发展角度看,短期内,由于文生视频可以根据给定的文字提示就直接生成视频,有望极大降低短视频制作的综合成本和门槛,为解决“重制作而轻创作”的共性问题提供解决方案,将对短视频、市场营销、动漫、社交媒体等行业产生影响,新一轮“行业洗牌”迫在眉睫,促使在产品、成本控制、生产流程等维度加速与大模型的融合和转型;长期内,由于Sora在生成视频长度、多角度镜头能力等方面显著优先,可以大幅减少实景拍摄,使得大模型的应用有望真正为企业降本增效,促进提高产品、服务质量或模式创新,也可能出现新的、空间更大的用户生成内容平台,会对文化、影视、娱乐、创意、游戏、教育、电商、医疗等产业产生深刻影响。

(三)从社会治理角度看,随着视频制作门槛和成本的降低,视频真实性、互动性、精准性的增强,很多人群很难分辨其真伪性,某些视频可能会被制作、滥用和恶意传播,成为部分犯罪分子进行电信诈骗、网络传销、敲诈勒索的工具,给人民群众生命财产安全带来威胁,影响社会长治久安;此外,某些视频也会为国内外别有用心的人加以制作和传播,有可能成为传播“政治谣言”“网络谣言”“带节奏”“低级红高级黑”,加剧“性别对立”“社会撕裂”的“放大器”,带来更多网络舆情风险和意识形态问题。Open AI表示,尽管在关键领域做了广泛的研究和测试,但仍无法预测用户使用Sora大模型的所有方式。这项新技术很可能为加密诈骗者所滥用,利用Sora为Web3和加密项目制作虚假的名人代言。此外,由于Sora在文生视频技术时长方面比之前最好的水平提升了15-20倍,诈骗者可以低成本的自动创建大量诈骗视频,在社交平台上病毒式传播。

(四)从劳动力的角度看,Sora的问世无疑将对一些传统行业和职业产生一定的冲击。首先,传统的视频制作通常需要大量的人力、时间和财力,而Sora模型通过其先进的AI算法能够快速生成符合描述的视频内容,从而极大地简化了制作流程,降低了制作成本。这势必使得传统视频制作公司不得不重新评估自己的竞争策略,可能需要进行技术升级,提升服务质量,以适应市场的变化。其次,一些视频编辑和后期制作从业者也可能受到Sora模型的挑战。传统视频编辑需要专业的技能和经验,而Sora模型的出现让视频生成变得更加简单和高效,可能会减少对人工编辑的需求。这意味着一些视频编辑从业者需要不断学习和提升自己的技能,适应新的市场需求,才能保持竞争力。另外,对于一些视频内容创作者,Sora模型的视频生成能力可能会扩大行业内内容同质化和竞争加剧的问题。这就需要内容创作者不断创新,提升内容质量和独特性,以吸引更多观众的关注和支持。

三、Sora带来挑战的同时,有哪些机遇可以把握?

对于文生视频大模型Sora,不必“过多追捧”“妖魔化”,要理性客观的看待,尊重技术发展客观规律,遵循产业成长基本路径。而同时,面临Sora等人工智能发展所带来的威胁,也需要各部门及时准确应对。Sora的发布为面临数字化转型的企业敲响了警钟。

目前,企业在数字化转型的过程中如何将数字化建设与AI融合利用,是大多数企业需要考虑的问题。前瞻性思维是适应人工智能时代的必备策略。面对人工智能技术的快速发展,制造企业不仅需要避免盲目恐慌,更要积极培养前瞻性的思考力。这意味着要学会利用AI工具作为创新和效率提升的助力,而非视其为威胁。在全球范围内强大的AI能力尚未完全普及之前,制造企业应抓住机遇,通过灵活运用现有AI技术,推进自身的数字化转型。

此外,在整合数字化建设和AI应用的过程中,制造企业必须保持理智的思考方式和理性的期望。尽管AI技术发展迅速,但数字化转型是一个渐进的旅程,而非瞬间能够达成的目标。企业家需要理性评估AI技术的成熟度、适用场景以及长期价值,从而制定出既切实可行又富有远见的转型策略。而对于许多传统企业而言,数字化基础和对新技术的认知往往是其发展的短板。这些制造企业可能对新技术抱有不切实际的高期望,而忽视了技术应用的现实挑战和局限性。因此,制造企业领导层需要建立更深入的数字化认识。这不仅意味着接受和探索先进技术,更重要的是要清楚地理解这些技术在实际应用中可能遇到的具体问题以及它们的适用性。

同时,有关部门还需进一步完善立法来约束生成式AI所带来的风险挑战。当前,我国已经为人工智能建构了多元化监管格局。2023年7月,我国颁布的《生成式人工智能服务管理暂行办法》,进一步明确将对生成式人工智能服务进行“分类”和“分级”监管,深度伪造服务的提供者必须对使用该产品生成的内容负责等相关条例。然而生成式技术的发展日新月异,法律规制手段存在一定滞后性,未来仍需进一步完善与AI相关的法律法规。

首先,要防止过度干预,实现生成式技术发展与公共利益保护之间的动态平衡。限制生成式人工智能发展,能够保障个人权益和社会公益,但同时可能会牺牲部分个体的自由权,甚至打击开发人员的积极性,因此明确干预手段的边界显得尤为重要。

其次,法律应当要求生成式人工智能技术的开发和使用遵守一定的伦理和道德准则,确保生成式人工智能的“无害性”以及公平公正,将人工智能朝着有利于人类团结的方向发展。这样方能确保新兴技术在法治上能发挥积极作用,做到法律以技术推进,技术有法可依。企业应抓住机遇,借助Sora助力跨界融合与协同创新。Sora的强大功能和灵活性使自身能够被广泛应用于多个行业,如汽车、医疗、金融等。因此,相关公司积极寻找与其他产业的跨界合作机会,探索新的商业模式和市场空间,并尽可能占据所属行业的战略位置。

此外,积极关注政府关于AI产业的政策动态和规划方向,参与相关项目和计划,争取政府支持和资源倾斜。如果能充分利用Sora等前沿AI技术,上市公司将有望巩固其在现有市场的领先地位,还能保持产品研发、客户服务等方面的灵活性和创新性,进而在激烈的市场竞争中获得长期的竞争优势。

中国还需加强算力建设,加大人才投入,破解算力难题。在全球范围内,算力短缺已成为人工智能发展的一大瓶颈,而对于中国来说,这一挑战更显得尤为严峻。中国的大模型企业不仅要应对人工智能用户指数型增长所带来的全球性的算力紧缺,还要面对英伟达等国际巨头对中国市场的供应限制,这种政策限制直接影响了中国企业获取高端GPU芯片的能力。

要解决算力短缺的问题,首先,中国要根据自身的算力需求特点和发展目标,制定合理的算力需求管理和人才培养方案,优化算力需求结构和分布,提高算力需求效率和质量,减少算力需求浪费和冗余,降低算力需求压力和风险。其次,要推进基础设施的共享与优化,在既有基础设施算力的约束条件下,通过算法的优化和数据的共享让应用端获得更多的算力。

本文仅代表作者观点。

举报

文章作者

一财最热
点击关闭