Apple presenta un modelo de IA para editar imágenes basado en comandos de texto
Laurenz Heymann/Unsplash.
Apple, junto con investigadores de la Universidad de California, ha desarrollado y publicado un modelo de inteligencia artificial llamado Edición de Imágenes Guiada por MLLM (MGIE). Permite hacer cambios en las imágenes basándose en instrucciones de texto en lenguaje natural.
Esto es lo que sabemos
MGIE utiliza la tecnología de los modelos multimodales de grandes lenguajes. Esto hace posible interpretar órdenes de usuario cortas y ambiguas para seguir editando fotos. Por ejemplo, una indicación de "hacer más saludable" para una foto de una pizza, la IA puede entenderla como una necesidad de añadir ingredientes vegetales.
Además de hacer cambios importantes en el contenido, el modelo puede realizar operaciones básicas como recortar, girar, cambiar el tamaño y corregir el color de las imágenes. La IA también puede procesar regiones individuales para transformar determinados objetos.
MGIE está disponible en GitHub. Además, Apple ha publicado una versión de demostración del servicio en el recurso Hugging Face.
Aún no se sabe si la empresa planea integrar la tecnología en sus propios productos.
Fuente: Engadget