//电报内容
【智源研究院发布原生多模态世界模型Emu3】《科创板日报》21日讯,《科创板日报》记者获悉,人工智能领域新型研发机构智源研究院正式发布原生多模态世界模型Emu3。据介绍,该模型实现了视频、图像、文本三种模态的统一理解与生成。Emu3采用了基于下一个token预测的多模态技术范式,释放其在大规模训练和推理上的潜力。(记者 李明明)
//解读摘要
大模型多模态及推理能力持续迭代升级,视频大模型迎来Sora时刻,这家公司InsightGPT具备文生文、视频智能剪辑、图生视频等功能,目前正在开发文生视频功能,另一家与外部技术公司联合打造“营销与电商”垂类大模型。