首页 > 视听 > 此刻

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

AI杀入视频游戏领域!谷歌发布Genie世界模型 一张图就能变成游戏

第一财经2024-02-29 11:54:54

作者:视点    责编:赵伟

举报

AI领域的发展速度令人震惊,先是文本到语音、图片、再到视频,如今文本到交互都已经来了。谷歌本周发布了一种全新的AI模型Genie,它可以接收文本提示、草图或想法,将其变成一个可以互动和玩耍的虚拟世界。

谷歌称Genie是专门从互联网视频中训练出来的基础世界模型,可以根据图像提示,生成各种各样动作可控的2D世界。模型由三部分组成:一个时空视频标记器、一个自回归动力学模型以及一个简单且可扩展的潜在行动模型。

对用户而言,只要提供一段文本、一张草图,Genie就会完成剩下的工作,生成一款2D游戏。与Sora呈现出来的高清晰度、高真实度相比,Genie似乎不那么强调画面真实性,而是将重点放在潜在动作预测上。

谷歌DeepMind表示,Genie为生成和进入虚拟世界打开了大门。例如可以采用最先进的文生图大模型来生成初始帧,然后用Genie赋予它们“生命”。

目前Genie是一个研究项目,而不是最终产品。它的训练视频是160x90像素的超低分辨率视频,每秒只有10帧,它生成的“游戏”同样是低分辨率的,每秒只有1帧,离实时可玩还很远,但DeepMind表示,Genie引入了一个能从图像或文本生成整个交互式世界的时代,它将成为训练未来通才AI智能体的催化剂。

AI杀入视频游戏领域!谷歌发布Genie世界模型 一张图就能变成游戏。点击视频,一看究竟!

文章作者

一财最热
点击关闭