Googles GameNGen kann Doom mit Echtzeitgeschwindigkeit auf Stable Diffusion erzeugen

Von: dmytro-miller | heute, 00:37

Google-Forscher haben ein neues KI-System entwickelt, das Doom spielt, ohne eine Spiel-Engine zu verwenden. Das System mit dem Namen GameNGen erzeugt ein Echtzeit-Gameplay mit 20 Bildern pro Sekunde auf einem einzigen Chip.

GameNGen ist die erste KI, die ein komplexes Videospiel mit hochwertiger Grafik und Interaktivität vollständig simuliert. Es läuft auf einer einzigen Tensor Processing Unit (TPU) und bewältigt die 3D-Umgebungen von Doom und die rasante Action effizient.

Das System verwendet ein Diffusionsmodell, um jeden Frame des Spiels vorherzusagen. Dieser Ansatz ermöglicht es, interaktive Echtzeit-Erlebnisse in einer komplexen Umgebung zu generieren, ohne auf traditionelle Game-Engine-Komponenten wie manuell programmierte Software für die Verwaltung des Spielzustands und das visuelle Rendering angewiesen zu sein.

"Wir präsentieren GameNGen, die erste Spiele-Engine, die vollständig von einem neuronalen Modell angetrieben wird und Echtzeit-Interaktion mit einer komplexen Umgebung über lange Strecken in hoher Qualität ermöglicht".

Dies schreiben die Forscher in ihrem auf arXiv veröffentlichten Papier.

Doom, das 1993 veröffentlicht wurde, diente lange Zeit als technologischer Maßstab. Es wurde auf verschiedene Plattformen portiert, darunter Mikrowellen und Digitalkameras. Jetzt stößt es an die Grenzen der KI-Fähigkeiten, indem es komplexe, interaktive Umgebungen in Echtzeit erzeugt.

Hat die Echtzeit-Diffusionsgenerierung eine Zukunft?

Die Entwicklung von GameNGen könnte die 200 Milliarden Dollar schwere globale Spieleindustrie auf den Kopf stellen. Sie hat das Potenzial, die Entwicklungszeit und -kosten zu senken, die Spielentwicklung zu demokratisieren und neue Genres dynamisch entwickelter Spiele zu ermöglichen.

Die Auswirkungen gehen über die Spielebranche hinaus. Branchen wie virtuelle Realität, autonome Fahrzeuge und intelligente Städte könnten von dieser Technologie profitieren. Zu den möglichen Anwendungen gehören Schulungs- und Testsimulationen, Betriebsmanagement, interaktive Bildungserfahrungen, Simulationen im Gesundheitswesen und entfernte Arbeitsumgebungen.

Es gibt jedoch noch einige Herausforderungen. Das System erfordert eine erhebliche Rechenleistung für moderne, grafikintensive Spiele. Es ist derzeit auf ein bestimmtes Spiel (Doom) zugeschnitten, und die Entwicklung einer universell einsetzbaren KI-Spiele-Engine bleibt eine Herausforderung.

In der Zukunft könnten wir KI-entwickelte und KI-gesteuerte Spiele sehen, die sich in Echtzeit an die Aktionen des Spielers anpassen und Inhalte on the fly generieren. Dies könnte die Entwicklungszeit und -kosten von Spielen reduzieren und die Entwicklung von Spielen weiter demokratisieren.

Mit der fortschreitenden Entwicklung der KI verschwimmen die Grenzen zwischen menschlicher Kreativität und maschineller Intelligenz. Die Zukunft virtueller Erlebnisse wird vielleicht nur durch die Vorstellungskraft der Maschinen begrenzt.