Отидете към основна версия

1 694 2

Невронната мрежа на Nvidia вече създава видео от текст

  • nvidia-
  • изкуствен интелект

Моделът е базиран на технологията за невронни мрежи Stable Diffusion

NVIDIA, в сътрудничество с изследователи от университета Корнел, представи VideoLDM, AI модел, способен да генерира видео с висока разделителна способност до 2 048x1 280 пиксела при 24 кадъра в секунда и продължителност от 4.7 секунди въз основа на текстови описания.

Моделът е базиран на технологията за невронни мрежи Stable Diffusion и има до 4.1 милиарда параметра, което го прави един от най-модерните генератори на текст към видео.

VideoLDM може също така да генерира видеоклипове до 5 минути в резолюция 1 024 x 512, използвайки само една снимка. Освен това VideoLDM може да предвиди множество правдоподобни сценарии въз основа на един и същ кадър.

Моделът NVIDIA VideoLDM AI може да се използва в различни приложения, включително във филмовата и телевизионна продукция, както и за разработката на видео игри. Вижте примери за видеоклипове на официалния уебсайт на nVidia.

Поставете оценка:
Оценка 3 от 6 гласа.

Свързани новини