Google оновлює свої ШІ-моделі Veo та Imagen для більш точного контенту

Автор: Влад Черевко | 16 грудня 2024, 21:14

Google анонсувала нову версію своєї моделі генеративного ШІ для відео, Veo 2, яка, за словами компанії, тепер краще розуміє фізику реального світу і рухів людини.

Що відомо

Veo 2 дозволяє користувачам посилатися на певні жанри фільмів, кінематографічні ефекти та об'єктиви під час створення відео. Модель також зменшує кількість артефактів, таких як зайві пальці, та покращує якість зображення. Нижче показано відео, повністю створене моделлю Veo 2.

Крім того, Google покращила свою модель перетворення тексту в зображення, Imagen 3, яка тепер генерує яскравіші та краще скомпоновані зображення, а також точніше слідує підказкам.

Зображення, створене моделлю Imagen 3. Ілюстрація: Google

Google також додала новий інструмент Whisk, який поєднує можливості Imagen 3 і моделі візуального розуміння Gemini, даючи змогу створювати унікальні зображення, об'єднуючи кілька ідей або об'єктів в одній ілюстрації.

Моделі включають невидимий водяний знак SynthID для зниження ймовірності дезінформації. Veo 2 буде поступово доступна користувачам Google Labs у США і зараз поки що обмежена для тестерів на створення відео до восьми секунд у форматі 720p. Покращення для моделі Imagen 3 вже доступні користувачам Google Labs у більш ніж 100 країнах через ImageFX.

Джерело: Google