DeepMind har avduket en AI-agent som er i stand til å utføre oppgaver i ukjente 3D-spill.

Av: Bohdan Kaminskyi | 14.03.2024, 18:01

Google DeepMind

Google DeepMind har demonstrert en ny kunstig intelligens-agent kalt SIMA (Scalable Instructable Multiworld Agent) som kan forstå og utføre oppgaver i 3D-spill basert på instruksjoner i naturlig språk.

Dette er hva vi vet

DeepMinds nye utvikling er den første som viser at den kunstige intelligensen er i stand til å følge kommandoer i et bredt spekter av spillverdener og miljøer som den ikke tidligere har vært i kontakt med. Ni kommersielle spill ble brukt til å trene opp SIMA, blant annet No Man's Sky, Teardown, Valheim og Goat Simulator 3.

Forskerne registrerte spillernes tastatur- og musebevegelser for å trene SIMA til å oppfatte naturlige språkinstruksjoner og styre spillfiguren deretter. Agenten kan utføre oppgaver av varierende kompleksitet, fra navigering til interaksjon med objekter og brukergrensesnittet.

SIMAs opplæringsprosess for AI-modeller

I tester har SIMA vist at den er i stand til å generalisere sine erfaringer fra enkelte spill til andre ukjente miljøer. SIMAs ytelse i ukjente spill var nesten den samme som en agent som var trent spesifikt på disse spillene.

Testresultater for SIMAs AI-modell

Språklige instruksjoner fra brukeren er imidlertid nødvendige for at SIMA skal fungere optimalt. Uten dem oppførte agenten seg usammenhengende og kaotisk.

DeepMind ser et stort potensial i å skape universelle språkstyrte AI-agenter basert på SIMA. I fremtiden forventer selskapet å utvikle systemer som trygt kan utføre et bredt spekter av oppgaver basert på menneskelige instruksjoner i virtuelle og virkelige miljøer.

Kilde: Engadget Engadget