DeepMind hat einen KI-Agenten vorgestellt, der Aufgaben in unbekannten 3D-Spielen ausführen kann

Von Bohdan Kaminskyi | 14.03.2024, 17:05
DeepMind hat einen KI-Agenten vorgestellt, der Aufgaben in unbekannten 3D-Spielen ausführen kann
Google DeepMind

Google DeepMind hat einen neuen Agenten mit künstlicher Intelligenz namens SIMA (Scalable Instructable Multiworld Agent) vorgestellt, der auf der Grundlage von Anweisungen in natürlicher Sprache Aufgaben in 3D-Spielen verstehen und ausführen kann.

Was bekannt ist

Die neue Entwicklung von DeepMind ist die erste, die zeigt, dass die KI in der Lage ist, Befehle in einer Vielzahl von Spielwelten und -umgebungen zu befolgen, mit denen sie bisher nicht in Berührung gekommen ist. Für das Training von SIMA wurden neun kommerzielle Spiele verwendet, darunter No Man's Sky, Teardown, Valheim und Goat Simulator 3.

Die Forscher zeichneten die Tastatur- und Mausaktionen der Spieler auf, um SIMA zu trainieren, Anweisungen in natürlicher Sprache zu erkennen und die Spielfigur entsprechend zu steuern. Der Agent kann Aufgaben unterschiedlicher Komplexität ausführen, von der Navigation bis zur Interaktion mit Objekten und der Benutzeroberfläche.

DeepMind hat einen KI-Agenten vorgestellt, der Aufgaben in unbekannten 3D-Spielen ausführen kann-2
SIMAs KI-Modell-Trainingsprozess

In Tests hat SIMA bewiesen, dass es in der Lage ist, seine Erfahrungen aus einigen Spielen effektiv auf andere, unbekannte Umgebungen zu verallgemeinern. Seine Leistung in unbekannten Spielen war fast die gleiche wie die eines Agenten, der speziell für diese Spiele trainiert wurde.

DeepMind hat einen KI-Agenten vorgestellt, der Aufgaben in unbekannten 3D-Spielen ausführen kann-3
Testergebnisse des KI-Modells von SIMA

Für eine optimale Leistung von SIMA sind jedoch Sprachanweisungen des Benutzers erforderlich. Ohne sie verhielt sich der Agent inkohärent und chaotisch.

DeepMind sieht großes Potenzial in der Entwicklung universeller sprachgesteuerter KI-Agenten auf der Grundlage von SIMA. Für die Zukunft erwartet das Unternehmen die Entwicklung von Systemen, die auf der Grundlage menschlicher Anweisungen eine Vielzahl von Aufgaben in virtuellen und realen Umgebungen sicher ausführen können.

Quelle: Engadget