DeepMind a dévoilé un agent d'IA capable d'effectuer des tâches dans des jeux 3D peu familiers.

Par: Bohdan Kaminskyi | 14.03.2024, 17:05
DeepMind a dévoilé un agent d'IA capable d'effectuer des tâches dans des jeux 3D peu familiers.
Google DeepMind

Google DeepMind a fait la démonstration d'un nouvel agent d'intelligence artificielle appelé SIMA (Scalable Instructable Multiworld Agent) capable de comprendre et d'exécuter des tâches dans des jeux en 3D sur la base d'instructions en langage naturel.

Ce que nous savons

Le nouveau développement de DeepMind est le premier à montrer la capacité de l'IA à suivre des commandes dans un large éventail de mondes et d'environnements de jeu qu'elle n'a jamais rencontrés auparavant. Neuf jeux commerciaux ont été utilisés pour entraîner SIMA, dont No Man's Sky, Teardown, Valheim et Goat Simulator 3.

Les chercheurs ont enregistré les actions du clavier et de la souris des joueurs afin d'entraîner SIMA à percevoir des instructions en langage naturel et à contrôler le personnage du jeu en conséquence. L'agent peut effectuer des tâches plus ou moins complexes, de la navigation à l'interaction avec les objets et l'interface utilisateur.

DeepMind a dévoilé un agent d'IA capable d'effectuer des tâches dans des jeux 3D peu familiers.-2
Processus de formation du modèle d'IA de la SIMA

Lors des tests, SIMA a démontré sa capacité à généraliser efficacement son expérience dans certains jeux à d'autres environnements inconnus. Ses performances dans les jeux inconnus étaient presque les mêmes que celles d'un agent formé spécifiquement à ces jeux.

DeepMind a dévoilé un agent d'IA capable d'effectuer des tâches dans des jeux 3D peu familiers.-3
Résultats des tests du modèle d'IA de SIMA

Cependant, les instructions linguistiques de l'utilisateur sont nécessaires pour que SIMA fonctionne de manière optimale. Sans elles, l'agent a agi de manière incohérente et chaotique.

DeepMind voit un grand potentiel dans la création d'agents d'IA universels pilotés par le langage et basés sur SIMA. À l'avenir, l'entreprise espère développer des systèmes capables d'exécuter en toute sécurité un large éventail de tâches sur la base d'instructions humaines dans des environnements virtuels et réels.

Source : Engadget Engadget