
{{aisd}}
AI生成 免责声明
6月22日,视频生成初创公司Sand.ai宣布完成新一轮融资,3个月内两轮融资金额合计超1亿美元,投资方包括快手创始人宿华、Lollapalooza Capital(王慧文家族办公室)、九坤创投、经纬创投等机构。另据记者了解,Sand.ai将于今年三季度开源新一代视频生成模型,采用MoE架构。
Sand.ai创始人曹越对第一财经记者表示,新模型将兼顾高效推理与目前开源领域较大参数规模,在人物一致及多镜头能力等方面追齐当前短剧商用等场景需求。
2023年,曹越参与美团联合创始人王慧文创立的光年之外,并担任算法联合创始人;2024年初,光年之外解散后,曹越创立Sand.ai。此后视频模型赛道遇冷,今年行业明显回暖,爱诗科技、智象未来、生数科技等公司宣布新融资,可灵AI、字节跳动Seedance系列、阿里通义万相Wan系列视频模型持续更新。
曹越对记者表示,2025年的“低温”主因行业缺少可验证的规模化营收标杆,投资人无法判断赛道真实市场空间;技术路线持续激烈争论,DiT、自回归路线价值无法落地验证。2026年,多家企业披露具体财务数据,二级市场给出清晰估值对标标的,一级机构重新测算视频赛道商业化天花板。
整体观察来看,曹越认为国内核心玩家底盘稳定,无头部企业出局,仅市场占有率会随新品迭代阶段性波动。核心原因是视频生成行业仍处于技术快速迭代周期,一款SOTA模型(最优模型)发布即可短期抢占舆论与商用客户注意力,一旦技术迭代放缓,市场声量会快速回落。相对国内,海外视频生成厂商——包括OpenAI Sora、Runway、Luma、Pika等,则呈现出收缩与战略调整的特征。

具体到企业产品,字节跳动Seedance2.0是今年“当红炸子鸡”。曹越认为,其核心优势在于多镜头叙事技术的提前布局。对比DiT扩散模型无法约束跨镜头空间逻辑的短板,他判断,多镜头一致性将成为区分视频模型商用价值的核心考核指标,也是B端付费客户筛选合作服务商的第一标准。
Sand.ai持续押注的自回归路线也在今年得到验证。2024年,行业主流选择DiT,自回归属于小众争议路线,外界普遍不看好;2025年后,自回归路线认可度持续快速提升,头部厂商均有所布局。
对于今年自回归路线的热度,曹越对记者表示,驱动因素分为四层:首先是商用需求倒逼,短剧、影视B端客户对多镜头、长时序一致性需求爆发,DiT原生短板无法满足商业化刚需;其次,世界模型叙事升温,全球学界、产业统一认定时序预测是世界模型核心能力,自回归路线具备跨赛道长期价值;第三层是MoE稀疏技术成熟,能够解决自回归算力消耗过高的痛点;第四层是落地案例验证,多家自研自回归模型跑出优于DiT的长视频效果,路线可行性被实际数据证实。
目前Sand.ai核心营收产品为音乐视频C端创作产品VidMuse,赛道长期年化ARR约30亿—50亿美元,目前仍处于极早期发展阶段,需求分散但总量庞大。即将发布的基于MoE架构的新模型有望通过MaaS服务成为第二增长区间,目前公司在国内与海外B端API市场同步开拓。