2025年02月10日 05:13:14
豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源
视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。不同于Sora 、DALL-E 、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。 目前,该项目代码与模型已开源。
收藏
292.61W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
评论(2)
热度
最新
一心听语2个月前 · IP未知
可以理解为利好AI眼镜吗?
(1)
回复1条回复
cls-2s1l2e回复一心听语2个月前 · IP未知
(0)
回复
AI视觉
关联话题
7318 人关注
1.07W 人关注
5.09W 人关注