Apple hat ein KI-Modell für die Bildbearbeitung auf der Grundlage von Textbefehlen vorgestellt
Laurenz Heymann/Unsplash.
Apple hat zusammen mit Forschern der Universität von Kalifornien ein Modell der künstlichen Intelligenz namens MLLM-Guided Image Editing (MGIE) entwickelt und veröffentlicht. Es ermöglicht es, Änderungen an Bildern auf der Grundlage von Textanweisungen in natürlicher Sprache vorzunehmen.
Was bekannt ist
MGIE nutzt die Technologie der multimodalen Modelle großer Sprachen. Damit ist es möglich, kurze und mehrdeutige Benutzerbefehle zu interpretieren, um Fotos weiter zu bearbeiten. So kann die KI beispielsweise die Aufforderung "Gesünder machen" für ein Pizzafoto als Aufforderung zum Hinzufügen von pflanzlichen Zutaten verstehen.
Das Modell kann nicht nur größere Änderungen am Inhalt vornehmen, sondern auch grundlegende Operationen wie das Zuschneiden, Drehen, Ändern der Größe und die Farbkorrektur von Bildern durchführen. Die KI kann auch einzelne Regionen bearbeiten, um bestimmte Objekte zu transformieren.
MGIE ist auf GitHub verfügbar. Darüber hinaus hat Apple eine Demoversion des Dienstes auf der Ressource Hugging Face veröffentlicht.
Es ist noch nicht bekannt, ob das Unternehmen plant, die Technologie in seine eigenen Produkte zu integrieren.
Quelle: Engadget