Інженер-програміст навчив штучний інтелект грати в Pokémon Red
Peter Whidden/YouTube
Інженер Пітер Відден (Peter Whidden) розробив штучний інтелект, який навчився грати в класичну гру Pokémon Red 1996 року, використовуючи метод навчання з підкріпленням. За кілька років ШІ провів у віртуальному світі Pokémon понад 50 000 годин.
Що відомо
Відден виклав на YouTube хвилинне відео, що демонструє роботу ШІ в грі. Також розробник опублікував на GitHub використаний ним код та інструкції, щоб інші користувачі могли створити власних віртуальних гравців на основі його алгоритмів.
Модель підкріплення стимулює ШІ підвищувати рівень покемонів у команді, досліджувати нові локації, вигравати бої та перемагати лідерів стадіонів. Іноді ці цілі розходяться з ігровим прогресом, що призводить до кумедної поведінки ШІ.
Наприклад, ШІ може "застрявати" в одному місці, милуючись оточенням, або зазнавати "травм" при випадковій втраті покемона. Така неоптимальна, але чарівна гра ШІ викликає симпатію у глядачів.
Спочатку ШІ не міг пройти навіть стартові локації, оскільки не вмів інтерпретувати текстові підказки в грі. Відден вніс зміни в код і алгоритми, щоб допомогти віртуальному гравцеві просунутися далі. Завдяки цьому ШІ зміг дістатися до перших печер за межами початкового міста.
За словами Віддена, такий підхід дає змогу цікаво пояснити роботу алгоритмів ШІ на прикладі популярної гри. Раніше навчання з підкріпленням уже застосовували для створення алгоритмів, що грають у шахи, го та інші ігри. Але проєкт на основі Pokémon Red привернув особливу увагу завдяки використанню улюблених персонажів як демонстрації складних концепцій ШІ.
Джерело: TechCrunch