2025年02月06日 15:01:38
字节跳动提出OmniHuman多模态框架 一张图配上音频即可生成逼真视频
《科创板日报》6日讯,字节跳动提出了一种名为OmniHuman的端到端多模态数字人视频生成框架,可基于一张图片和运动信号(如音频、视频或两者)生成视频。该框架混合数据训练策略,科技媒体TechSpot称它可能是目前最逼真的深度仿真算法。不过,该框架目前暂未向公众提供服务。
收藏
305W
我要评论
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
关联话题
2.09W 人关注
1.08W 人关注
4.98W 人关注