AI enseñada a determinar la hora con las manecillas del reloj

Por: Yuriy Stanislavskiy | 26.11.2021, 10:20
AI enseñada a determinar la hora con las manecillas del reloj

Leer la hora de los relojes analógicos es sorprendentemente difícil para las computadoras, pero ahora la inteligencia artificial puede manejar esta tarea con precisión. La IA, entrenada con imágenes de relojes tomadas desde diferentes ángulos, pudo determinar la hora en la que mostraban los dispositivos.

Desde hace mucho tiempo, la visión por computadora ha podido leer la hora de un reloj digital con solo mirar los números en la pantalla. Pero los relojes analógicos son mucho más complejos debido a una serie de factores, incluidos los diferentes diseños y el hecho de que las manecillas ocultan sombras y reflejos.

Investigadores de la Universidad de Oxford han desarrollado un sistema que puede leer la esfera de un reloj analógico con una precisión del 74% al 84%. Los científicos entrenaron un modelo de visión por computadora en tres conjuntos de imágenes de reloj generadas desde diferentes ángulos.

Estas imágenes, así como la hora correcta mostrada por el reloj, se utilizaron para entrenar una red neuronal con un módulo STN que podría distorsionar una imagen en ángulo para verla exactamente a 90 grados. Las versiones anteriores de tales redes neuronales, sin el módulo STN, cometían errores al transformar imágenes.

La creación de conjuntos de datos adicionales ayuda a los autores de un nuevo desarrollo a enseñar al algoritmo a realizar correctamente su tarea. El modelo también fue entrenado en una serie de videos con movimientos acelerados de la mano a través del dial. Los científicos "alimentaron" el algoritmo con 4472 imágenes de reloj.

Cuando un modelo falla en la tarea, la mayoría de las veces se debe al hecho de que confunde las manecillas de minutos y horas de la misma longitud. Las personas pueden lidiar con esta complejidad evaluando las diferentes velocidades de las flechas, pero esto obviamente no funciona con imágenes estáticas.

Una fuente: arxivcientífico nuevo