Microsoft onthult tools voor dipfake en het klonen van stemmen
Microsoft
Tijdens de Ignite-conferentie kondigde Microsoft een dienst aan voor het maken van fotorealistische avatars van mensen met lipanimatie volgens een bepaalde tekst. Het toonde ook een tool voor het klonen van stemmen aan de hand van audiomonsters.
Dit is wat we weten
Met de nieuwe Azure AI Speech tekst-naar-spraak avatar service kun je een foto van een persoon uploaden en een script samenstellen. Op basis hiervan wordt dan een video van een sprekende avatar gegenereerd.
De digitale dubbelgangers kunnen verschillende talen spreken. In scripts kunnen ze gebruik maken van kunstmatige intelligentie modellen zoals OpenAI's GPT-3.5 om vragen van klanten te beantwoorden buiten scripts om.
Een andere Personal voice-functie kan de stem van een gebruiker in enkele seconden namaken. Hiervoor is een audio-opname van een minuut nodig.
Het bedrijf stelt voor om Personal voice te gebruiken voor het maken van gepersonaliseerde stemassistenten, het nasynchroniseren van content in verschillende talen en het maken van aangepaste vertellingen voor verhalen, audioboeken en podcasts.
Volgens Microsoft zullen beide tools beschikbaar zijn voor een beperkt aantal gebruikers en alleen voor bepaalde scenario's. Daarnaast moeten klanten expliciet toestemming geven voor het gebruik van hun stem en beeld.
Dit is bedoeld om mogelijk misbruik van de technologie te beperken, zodat dipfakes kunnen worden gemaakt zonder dat mensen hiervan op de hoogte zijn. Microsoft zegt dat het de ethiek van AI op een verantwoorde manier benadert.