OpenAI представи най-новия си пробив в областта на технологиите за изкуствен интелект с въвеждането на Sora - авангарден модел, който използва силата на текста за генериране на видеоклипове. Разработена от създателите на ChatGPT, Sora представлява значителен скок напред в областта на създаването на видеоклипове, като предлага възможности като генериране на видеоклипове с различни резолюции и съотношения на страните, редактиране на съществуващи видеоклипове и безпроблемно разширяване на видеосъдържанието въз основа на текстови подсказки.
Една от най-впечатляващите характеристики на Sora е способността ѝ да редактира лесно съществуващи видеоклипове, като позволява бързи промени в декора, осветлението и стила на снимане - всичко това чрез проста текстова команда. Освен това Sora може да генерира видеоклипове въз основа на неподвижни изображения и дори да попълва липсващи кадри, за да разшири съществуващ видеоматериал.
Според OpenAI в момента Sora е в състояние да създава до една минута Full HD видеосъдържание. Технологията, която стои в основата на Sora, се основава на трансформаторна архитектура, подобна на тази на ChatGPT, при която видеоклиповете и изображенията се разбиват на по-малки единици, наречени пачове. Sora започва процеса на генериране на видео чрез преобразуване на статичен шум, като постепенно го усъвършенства, за да получи крайния резултат.
По отношение на мерките за безопасност OpenAI е внедрила протоколи, подобни на тези, използвани в модела DALL-E 3. За да се гарантира допълнително безопасността и надеждността на Sora, моделът в момента е подложен на строги тестове от "червени екипи" - експерти, натоварени със задачата да идентифицират и отстранят потенциалните рискове преди официалното пускане на модела.
В допълнение към тестовете за безопасност OpenAI планира да участва в дискусии с политици, артисти и преподаватели, за да проучи потенциалните проблеми и случаи на използване на Sora. За момента не е обявена официална дата на пускане, но очакваме това да бъде оповестено скоро.