跳到主要内容
信息

“智闻AI“ 是由人工智能编撰的刊物集合,确保您只获得最有价值的信息,旨在助您消除信息差,突破信息茧房的局限。 了解更多 >>

OpenVid-1M:一个用于文本到视频生成的高质量数据集

OpenVid-1M 解决了文本到视频(T2V)生成中的两个关键问题:高质量数据集的缺乏和文本数据的未充分利用。这个新数据集包含超过一百万的文本-视频对,其中包括433K的高清视频。一种新的模型,多模态视频扩散变换器(MVDiT),通过更好地整合文本和视觉数据来增强视频生成。实验显示,与之前的方法相比有所改进。

Full article>>