首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

可灵AI推出全球首部AIGC单元剧,行业早期仍需“反复抽卡”

第一财经 2025-06-25 23:49:40 听新闻

作者:吕倩    责编:宁佳彦

当下AI创作尚未达到一键生成、拿来即用的程度。

科幻、历史、奇幻、荒诞喜剧等多元题材,首次汇总于一部AIGC单元剧集产品中。6月25日,快手科技(1024.HK)可灵AI与星芒短剧联合出品、影视出品公司异类Outliers团队制作的全球首部AI单元故事集《新世界加载中》举行首映礼。

实际观影过程中,记者发现,《新世界加载中》剧集内容创新、科幻元素丰富,通过详细动作脚本与首尾帧技术,解决了快速连续的打斗动作难以衔接流畅的难点。但同时,剧集存在人物一致性不足、人物情感情绪表达欠缺、群像画面中人脸崩坏等问题。

采访环节,可灵AI产品及运营负责人李杨强调视频模型的早期状态,当下AI创作尚未达到一键生成、拿来即用的程度,需要创作者通过AI工具反复写prompt(提示词)、调prompt、抽卡、调视频,非常考验创作者的创造力与韧性。视频生成领域的“抽卡”是指由于生成效果具有不确定性,用户需要多次尝试。因此目前可灵AI的消费群体主要是相对专业的创作者。

可灵AI在商业化方面进展迅速,此前官方披露ARR(年度经常性收入)超1亿美元,高盛预测可灵AI 2025年收入规模将超1.2亿美元,目前其他竞品厂商暂未有超过该数据的公开披露。但在技术表现上,李杨表示,可灵AI在稳定性、运动表现、清晰度等方面仍有一定问题。目前团队重点聚焦语义遵从、运动表现等方面进行完善,比如运动速度、质量、美感、自然度,以及符合物理规律的程度等。

即便如此,可灵AI自发布后持续占据视频模型行业头部位置。根据Artificial Analysis视频生成榜单,谷歌Veo系列和快手可灵系列分别位于文生视频、图生视频的一二位,东方证券分析师认为二者的技术实力位于T0梯队。两相对比,谷歌在今年5月发布的Veo3视频大模型新品,基于更强的音视频同步生成、参考图视频生成、相机控制视频生成等功能,在创作者群体中引发热议。

对此,李杨表达了对谷歌Veo3技术能力的认可,她对记者表示,谷歌Veo3音视频同步生成功能的确令人惊艳,而可灵AI考虑的视角更偏向技术落地与产品体验,例如Veo3的音效同步生成功能虽然带来便捷,也同时,由于音效很难通过prompt保持一致,因此会带来音色方面的不可控性。可灵AI选择的路径是尽早与用户群体进行交互,了解用户的需求,并针对性迭代更新。

整体来看,李杨认为不论是可灵AI还是其他视频大模型,虽然起点与速度不同,但都在一个大的起点范围内,未来行业还有非常多事情去做,待模型的基础表达、稳定性、可控性均达到临界点之后,才会诞生更多更新的实用型产品形态。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com

文章作者

一财最热
点击关闭