KI hat beigebracht, die Zeit mit den Zeigern der Uhr zu bestimmen

Von Yuriy Stanislavskiy | 26.11.2021, 10:22
KI hat beigebracht, die Zeit mit den Zeigern der Uhr zu bestimmen

Das Ablesen der Zeit von analogen Uhren ist für Computer überraschend schwierig, aber jetzt kann künstliche Intelligenz diese Aufgabe genau bewältigen. Die KI, die mit Bildern von Uhren trainiert wurde, die aus verschiedenen Blickwinkeln aufgenommen wurden, war in der Lage, die Zeit zu bestimmen, die die Geräte anzeigten.

Computer Vision ist seit langem in der Lage, die Zeit von einer Digitaluhr abzulesen, indem man nur auf die Zahlen auf dem Bildschirm schaut. Analoge Uhren sind jedoch aufgrund einer Reihe von Faktoren viel komplexer, darunter unterschiedliche Designs und die Tatsache, dass Zeiger Schatten und Reflexionen verbergen.

Forscher der Universität Oxford haben ein System entwickelt, das das Zifferblatt einer analogen Uhr mit einer Genauigkeit von 74 bis 84 % lesen kann. Die Wissenschaftler trainierten ein Computer-Vision-Modell an drei Sätzen generierter Uhrbilder aus verschiedenen Blickwinkeln.

Diese Bilder sowie die von der Uhr angezeigte korrekte Zeit wurden verwendet, um ein neuronales Netzwerk mit einem STN-Modul zu trainieren, das ein abgewinkeltes Bild verzerren konnte, um es bei genau 90 Grad anzuzeigen. Frühere Versionen solcher neuronaler Netze ohne das STN-Modul machten Fehler beim Transformieren von Bildern.

Die Erstellung zusätzlicher Datensätze hilft den Autoren einer Neuentwicklung, dem Algorithmus beizubringen, seine Aufgabe richtig zu erfüllen. Das Modell wurde auch an einer Reihe von Videos mit beschleunigten Handbewegungen über das Zifferblatt trainiert. Wissenschaftler "fütterten" den Algorithmus mit 4472 Uhrbildern.

Wenn ein Modell die Aufgabe nicht erfüllt, liegt es meistens daran, dass es die gleich langen Minuten- und Stundenzeiger verwechselt. Man kann mit dieser Komplexität umgehen, indem man die unterschiedlichen Geschwindigkeiten der Pfeile auswertet, aber das funktioniert offensichtlich nicht mit statischen Bildern.

Eine Quelle: arxivNachrichtenwissenschaftler