Apple onthult een AI-model voor het bewerken van afbeeldingen op basis van tekstopdrachten
Laurenz Heymann/Unsplash.
Apple heeft samen met onderzoekers van de Universiteit van Californië een model voor kunstmatige intelligentie ontwikkeld en gepubliceerd met de naam MLLM-Guided Image Editing (MGIE). Hiermee kunnen wijzigingen in afbeeldingen worden aangebracht op basis van tekstinstructies in natuurlijke taal.
Dit is wat we weten
MGIE maakt gebruik van de technologie van multimodale modellen van grote talen. Dit maakt het mogelijk om korte en dubbelzinnige gebruikerscommando's te interpreteren om foto's verder te bewerken. Bijvoorbeeld, een "maak gezonder" prompt voor een pizzafoto kan de AI begrijpen als een behoefte om groente-ingrediënten toe te voegen.
Naast het maken van grote inhoudelijke wijzigingen, kan het model basisbewerkingen uitvoeren zoals bijsnijden, roteren, formaat aanpassen en afbeeldingen kleur corrigeren. De AI kan ook individuele regio's bewerken om bepaalde objecten te transformeren.
MGIE is beschikbaar op GitHub. Daarnaast heeft Apple een demoversie van de dienst geplaatst op de Hugging Face bron.
Het is nog niet bekend of het bedrijf van plan is om de technologie in zijn eigen producten te integreren.
Bron: Engadget