"Cambio de paradigma" en robótica: Robot Alter3 combinado con GPT-4: ahora puede hacerse selfies y tocar una guitarra imaginaria y se programa con la voz en lugar de con órdenes complejas.
Un equipo de investigadores de la Universidad de Tokio consiguió establecer un vínculo entre el modelo de lenguaje grande GPT-4 y el robot Alter3, lo que les permitió realizar gestos más parecidos a los humanos y programar el robot en lenguaje natural, abandonando los sistemas de control tradicionales dependientes del hardware. Los autores del proyecto calificaron este avance de "cambio de paradigma" en robótica.
Alter3 es la última versión del robot humanoide, que se puso en funcionamiento por primera vez en 2016. Es capaz de realizar movimientos complejos de la parte superior del cuerpo, incluidas expresiones faciales detalladas, y tiene 43 ejes que imitan el movimiento del sistema musculoesquelético humano. Se apoya en una base, pero no puede caminar (aunque sí simularlo). Con GPT-4, los investigadores enseñaron al robot a realizar varias simulaciones, como hacerse un selfie, lanzar una pelota, comer palomitas y tocar una guitarra imaginaria. Antes, estas actividades requerían codificar instrucciones específicas para cada acción, pero con GPT-4, los robots pueden aprender instrucciones verbales ordinarias.
Los investigadores afirman que "ahora es posible el control directo transfiriendo las expresiones lingüísticas de las acciones humanas al cuerpo del robot mediante código de software. Esto permite mayores oportunidades de colaboración entre humanos y robots. Con este avance en robótica, podemos esperar entidades robóticas más inteligentes, adaptables y personales". El robot Alter3 lleva incorporada una cámara que le permite "ver" a las personas y mejorar su comportamiento observando sus reacciones.
Mediante el uso de modelos lingüísticos en la investigación robótica, los científicos simplifican enormemente el proceso de coordinación de las numerosas articulaciones de un robot proporcionando instrucciones verbales, describiendo las opciones de movimiento y obteniendo el código de software que pone en marcha el motor del robot. Esto elimina la mundana tarea de programar cada movimiento individual para 43 ejes y permite a los investigadores reconfigurar y perfeccionar los movimientos del robot con mayor rapidez, suavidad y precisión a lo largo del tiempo.
Los investigadores también añadieron un poco de humor a las actividades de Alter3. En un escenario, el robot demuestra que se está comiendo una bolsa de palomitas, pero luego resulta que las palomitas pertenecen a una persona sentada a su lado. Las expresiones faciales y los movimientos de las manos del robot transmiten sorpresa y vergüenza.
Fuente: techxplore.com