OpenAI представила Sora — модель ИИ для преобразования текста в видео
OpenAI
Компания OpenAI анонсировала новую модель генерации видео под названием Sora, которая может создавать реалистичные и фантазийные ролики длиной до минуты по текстовому описанию.
Что известно
По словам OpenAI, Sora создает сложные многофигурные сцены, точно располагает объекты и персонажей в кадре. Модель также способна генерировать различные типы движений.
Разработчики отметили способность ИИ детализировать фон, отдельные предметы и персонажей. Более того, она может генерировать лица героев с яркими и разнообразными эмоциями.
OpenAI утверждает, что их модель обладает определенным "пониманием" физических законов реального мира. Однако иногда возникают сложности при создании сложных сцен и причинно-следственных связей.
Помимо синтеза видео "с нуля", Sora может дорабатывать и расширять уже имеющиеся видеозаписи. Она способна заполнять пропущенные кадры в последовательности изображений.
В настоящее время Sora доступна только "красным командам", которые оценивают модель на предмет потенциального вреда и рисков. OpenAI также открыла доступ некоторым визуальным художникам, дизайнерам и режиссерам, чтобы получить обратную связь.
Источник: OpenAI