Un ingénieur logiciel a entraîné une intelligence artificielle à jouer à Pokémon Red

Par: Bohdan Kaminskyi | 19.10.2023, 17:33
Un ingénieur logiciel a entraîné une intelligence artificielle à jouer à Pokémon Red
Peter Whidden/YouTube

L'ingénieur Peter Whidden a mis au point une intelligence artificielle qui a appris à jouer au jeu classique de 1996 Pokémon Rouge grâce à l'apprentissage par renforcement. L'IA a passé plus de 50 000 heures dans le monde virtuel de Pokémon au fil des ans.

Ce que nous savons

Whidden a publié sur YouTube une vidéo d'une minute montrant le fonctionnement de l'IA dans le jeu. Le développeur a également publié le code et les instructions qu'il a utilisés sur GitHub afin que d'autres utilisateurs puissent créer leurs propres joueurs virtuels sur la base de ses algorithmes.

Le modèle de renforcement incite l'IA à augmenter le niveau des Pokémon d'une équipe, à explorer de nouveaux lieux, à gagner des batailles et à vaincre les chefs de stade. Parfois, ces objectifs divergent de la progression du jeu, ce qui donne lieu à des comportements amusants de la part de l'IA.

Par exemple, l'IA peut rester "coincée" à un endroit tout en admirant son environnement, ou subir un "traumatisme" lorsqu'elle perd accidentellement un Pokémon. Ces comportements sous-optimaux mais attachants de l'IA suscitent la sympathie du public.

Au départ, l'IA ne pouvait même pas dépasser les lieux de départ parce qu'elle ne pouvait pas interpréter les indices textuels du jeu. Whidden a modifié le code et les algorithmes pour aider le joueur virtuel à progresser. L'IA a ainsi pu atteindre les premières grottes situées à l'extérieur de la ville initiale.

Selon M. Whidden, cette approche permet d'expliquer de manière intéressante le fonctionnement des algorithmes de l'IA en utilisant l'exemple d'un jeu populaire. L'apprentissage par renforcement a déjà été utilisé pour créer des algorithmes qui jouent aux échecs, au jeu de Go et à d'autres jeux. Mais un projet basé sur Pokémon Red a particulièrement attiré l'attention en raison de l'utilisation des personnages préférés comme démonstration de concepts d'IA complexes.

Source : TechCrunch TechCrunch