"Paradigmaverschuiving' in robotica: Alter3 robot gecombineerd met GPT-4: nu kan hij selfies nemen en een denkbeeldige gitaar bespelen en wordt hij geprogrammeerd door middel van spraak in plaats van complexe commando's

Via: Anry Sergeev | 19.12.2023, 19:58

Een team onderzoekers van de Universiteit van Tokio was in staat om een koppeling te maken tussen het GPT-4 grote taalmodel en de Alter3 robot, waardoor ze meer mensachtige gebaren konden uitvoeren en de robot in natuurlijke taal konden programmeren, waardoor ze traditionele hardware-afhankelijke besturingssystemen konden loslaten. De auteurs van het project noemden deze vooruitgang een "paradigmaverschuiving" in de robotica.

Alter3 is de nieuwste versie van de humanoïde robot, die in 2016 voor het eerst in gebruik werd genomen. Hij kan complexe bewegingen van het bovenlichaam uitvoeren, waaronder gedetailleerde gezichtsuitdrukkingen, en heeft 43 assen die de bewegingen van het menselijke bewegingsapparaat nabootsen. Het rust op een basis maar kan niet lopen (hoewel het lopen wel kan simuleren). Met behulp van GPT-4 leerden de onderzoekers de robot verschillende simulaties uit te voeren, zoals het nemen van een selfie, het gooien van een bal, het eten van popcorn en het spelen op een denkbeeldige gitaar. Voorheen moesten voor deze activiteiten specifieke instructies worden gecodeerd voor elke actie, maar met GPT-4 kunnen robots gewone spraakinstructies leren.


-"Rook op het water" afspelen

De onderzoekers stellen dat "directe besturing nu mogelijk is door de linguïstische uitdrukkingen van menselijke acties via softwarecode over te brengen op het robotlichaam. Dit biedt meer mogelijkheden voor samenwerking tussen mens en robot. Met deze doorbraak in de robotica kunnen we meer intelligente, adaptieve en persoonlijke robotentiteiten verwachten. De Alter3 robot heeft een ingebouwde camera waarmee hij mensen kan "zien" en zijn gedrag kan verbeteren door hun reacties te observeren.

Door het gebruik van taalmodellen in roboticaonderzoek kunnen wetenschappers het proces van het coördineren van de vele gewrichten van een robot sterk vereenvoudigen door verbale instructies te geven, bewegingsopties te beschrijven en de softwarecode te verkrijgen die de motor van de robot start. Hierdoor vervalt de alledaagse taak van het programmeren van elke individuele beweging voor 43 assen en kunnen onderzoekers de bewegingen van de robot sneller, soepeler en nauwkeuriger herconfigureren en verfijnen.


Alter3 pronkt met zombies

De onderzoekers voegden ook een beetje humor toe aan de activiteiten van Alter3. In één scenario laat de robot zien dat hij een zak popcorn aan het eten is, maar dan blijkt dat de popcorn van een persoon is die naast hem zit. De gezichtsuitdrukkingen en handbewegingen van de robot geven verbazing en schaamte weer.

Bron: techxplore.com