
{{aisd}}
AI生成 免责声明
7月4日,世界人工智能大会(WAIC 2024)在上海召开,由商汤科技打造的首个面向C端用户的可控人物视频生成大模型Vimi亮相。商汤方面介绍,基于商汤日日新大模型的能力,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。
与图片表情控制类技术只能控制头部表情动作不同,商汤介绍,Vimi能够实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化,可稳定生成1分钟的单镜头人物类视频,据悉Vimi将完全面向C端用户开放使用。
智谱有望成为“全球基座大模型第一股”,MiniMax有望成为“全球多模态大模型第一股”。
加班、浮躁、攀比、裁员……汽车人被“卷”走。
“闭环生态能造就巨头,开放生态能造就产业。”
OpenAI宣布推出依托Sora 2的视频社交应用,用户可通过文本提示生成带音频的高清短片,并与他人互动。
在视频末尾,G1还展现了连续空翻的能力。