OpenAI представила Sora — модель ИИ для преобразования текста в видео

Автор: Богдан Каминский, 15 февраля 2024, 21:59

OpenAI

Компания OpenAI анонсировала новую модель генерации видео под названием Sora, которая может создавать реалистичные и фантазийные ролики длиной до минуты по текстовому описанию.

Что известно

По словам OpenAI, Sora создает сложные многофигурные сцены, точно располагает объекты и персонажей в кадре. Модель также способна генерировать различные типы движений.

Разработчики отметили способность ИИ детализировать фон, отдельные предметы и персонажей. Более того, она может генерировать лица героев с яркими и разнообразными эмоциями.

OpenAI утверждает, что их модель обладает определенным "пониманием" физических законов реального мира. Однако иногда возникают сложности при создании сложных сцен и причинно-следственных связей.

Помимо синтеза видео "с нуля", Sora может дорабатывать и расширять уже имеющиеся видеозаписи. Она способна заполнять пропущенные кадры в последовательности изображений.

В настоящее время Sora доступна только "красным командам", которые оценивают модель на предмет потенциального вреда и рисков. OpenAI также открыла доступ некоторым визуальным художникам, дизайнерам и режиссерам, чтобы получить обратную связь. 

Источник: OpenAI