据豆包大模型团队官方公众号,视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。VideoWorld仅通过“视觉信息”,即浏览视频数据,就能让机器掌握推理、规划和决策等复杂能力。团队实验发现,仅300M参数量下,VideoWorld已取得可观的模型表现。东吴证券表示,随着字节豆包、DeepSeek、阿里通用等大模型生态共荣,看好端侧赛道的投资机会。字节的投入加速了国内AI大模型及应用的进展,未来有望给算力、数据/IP提供商及下游细分链条上的合作伙伴带来业务增量和投资机会。