NVIDIA, в сътрудничество с изследователи от университета Корнел, представи VideoLDM, AI модел, способен да генерира видео с висока разделителна способност до 2 048x1 280 пиксела при 24 кадъра в секунда и продължителност от 4.7 секунди въз основа на текстови описания.
Моделът е базиран на технологията за невронни мрежи Stable Diffusion и има до 4.1 милиарда параметра, което го прави един от най-модерните генератори на текст към видео.
VideoLDM може също така да генерира видеоклипове до 5 минути в резолюция 1 024 x 512, използвайки само една снимка. Освен това VideoLDM може да предвиди множество правдоподобни сценарии въз основа на един и същ кадър.
Моделът NVIDIA VideoLDM AI може да се използва в различни приложения, включително във филмовата и телевизионна продукция, както и за разработката на видео игри. Вижте примери за видеоклипове на официалния уебсайт на nVidia.