"Changement de paradigme" en robotique : Robot Alter3 combiné au GPT-4 : il peut désormais prendre des selfies et jouer d'une guitare imaginaire, et il est programmé par la voix au lieu de commandes complexes.
Une équipe de chercheurs de l'université de Tokyo a réussi à établir un lien entre le grand modèle linguistique GPT-4 et le robot Alter3, ce qui leur a permis d'effectuer des gestes plus proches de ceux de l'homme et de programmer le robot en langage naturel, abandonnant ainsi les systèmes de contrôle traditionnels dépendant du matériel. Les auteurs du projet ont qualifié ce progrès de "changement de paradigme" dans le domaine de la robotique.
Alter3 est la dernière version du robot humanoïde, qui a été mis en service pour la première fois en 2016. Il est capable d'effectuer des mouvements complexes de la partie supérieure du corps, y compris des expressions faciales détaillées, et possède 43 axes qui imitent les mouvements du système musculo-squelettique humain. Il repose sur une base mais ne peut pas marcher (bien qu'il puisse simuler la marche). À l'aide du GPT-4, les chercheurs ont appris au robot à effectuer diverses simulations, comme prendre un selfie, lancer une balle, manger du pop-corn et jouer d'une guitare imaginaire. Auparavant, ces activités nécessitaient le codage d'instructions spécifiques pour chaque action, mais avec le GPT-4, les robots peuvent apprendre des instructions vocales ordinaires.
Les chercheurs affirment que "le contrôle direct est désormais possible en transférant les expressions linguistiques des actions humaines au corps du robot par le biais d'un code logiciel. Cela ouvre de nouvelles perspectives de collaboration entre l'homme et le robot. Grâce à cette avancée dans le domaine de la robotique, nous pouvons nous attendre à des entités robotiques plus intelligentes, adaptatives et personnelles. Le robot Alter3 est doté d'une caméra intégrée qui lui permet de "voir" les gens et d'améliorer son comportement en observant leurs réactions.
Grâce à l'utilisation de modèles de langage dans la recherche en robotique, les scientifiques simplifient considérablement le processus de coordination des nombreuses articulations d'un robot en fournissant des instructions verbales, en décrivant les options de mouvement et en obtenant le code logiciel qui démarre le moteur du robot. Cela élimine la tâche banale de programmer chaque mouvement individuel pour 43 axes et permet aux chercheurs de reconfigurer et d'affiner les mouvements du robot de manière plus rapide, plus souple et plus précise au fil du temps.
Les chercheurs ont également ajouté un peu d'humour aux activités d'Alter3. Dans un scénario, le robot montre qu'il est en train de manger un sac de pop-corn, mais il s'avère que le pop-corn appartient à une personne assise à côté de lui. Les expressions faciales et les mouvements des mains du robot traduisent la surprise et la honte.
Source : techxplore.com