DeepMind ha presentado un agente de IA capaz de realizar tareas en juegos 3D desconocidos

Por: Bohdan Kaminskyi | 14.03.2024, 18:05
DeepMind ha presentado un agente de IA capaz de realizar tareas en juegos 3D desconocidos
Google DeepMind

Google DeepMind ha demostrado un nuevo agente de inteligencia artificial llamado SIMA (Scalable Instructable Multiworld Agent) que puede entender y realizar tareas en juegos 3D basándose en instrucciones de lenguaje natural.

Esto es lo que sabemos

El nuevo desarrollo de DeepMind es el primero en demostrar la capacidad de la IA para seguir órdenes en una amplia gama de mundos de juego y entornos que no había encontrado anteriormente. Para entrenar a SIMA se utilizaron nueve juegos comerciales, entre ellos No Man's Sky, Teardown, Valheim y Goat Simulator 3.

Los investigadores grabaron las acciones del teclado y el ratón de los jugadores para entrenar a SIMA a percibir instrucciones en lenguaje natural y controlar al personaje del juego en consecuencia. El agente puede realizar tareas de distintos niveles de complejidad, desde la navegación hasta la interacción con objetos y la interfaz de usuario.

DeepMind ha presentado un agente de IA capaz de realizar tareas en juegos 3D desconocidos-2
Proceso de entrenamiento del modelo de IA de SIMA

En las pruebas, SIMA demostró su capacidad para generalizar eficazmente su experiencia en algunos juegos a otros entornos desconocidos. Su rendimiento en juegos desconocidos fue casi el mismo que el de un agente entrenado específicamente en esos juegos.

DeepMind ha presentado un agente de IA capaz de realizar tareas en juegos 3D desconocidos-3
Resultados de las pruebas del modelo de IA de SIMA

Sin embargo, las instrucciones lingüísticas del usuario son necesarias para que SIMA funcione de forma óptima. Sin ellas, el agente actuaba de forma incoherente y caótica.

DeepMind ve un gran potencial en la creación de agentes de IA universales basados en SIMA. En el futuro, la empresa espera desarrollar sistemas que puedan realizar con seguridad una amplia gama de tareas basadas en instrucciones humanas en entornos virtuales y del mundo real.

Fuente: Engadget