Google entwickelt SiliFuzz-Projekt zur Massenerkennung von versteckten CPU-Fehlern
Google hat hart daran gearbeitet, Softwarefehler in wichtigen Open-Source-Projekten proaktiv zu erkennen. Jetzt wurde bekannt, dass das Unternehmen auch SiliFuzz entwickelt, ein System, das Fehler in Prozessoren aufspüren soll.
Worum es sich handelt
Das Prinzip von SiliFuzz besteht darin, die Prozessorleistung zu analysieren, indem mit Emulatoren gesammelte, vorbereitete Testdaten ausgeführt werden. Es handelt sich um eine Form des Phasing - der Prozessor wird mit "zufälligen" Berechnungen belastet, deren Ergebnis am Ausgang überprüft wird. Bei einer Abweichung gilt der Prozessor als fehlerhaft.
Warum es gebraucht wird
Das System dient in erster Linie dazu, elektrische Defekte in den Chips zu erkennen, die bei der Herstellung, der Montage, dem Arbeitsablauf usw. auftreten können. Diesen wird besondere Aufmerksamkeit gewidmet und nicht den logischen Fehlern in den Prozessoren selbst. Gleichzeitig verwenden die fraglichen Tests keine Low-Level-Debugging-Mechanismen, so dass sie in "lebenden" Systemen eingesetzt werden können.
Die Aufgabe der Entwickler besteht im Wesentlichen darin, ein System zu schaffen, das routinemäßig jeden Kern eines jeden Google-Servers mit minimalen Auswirkungen auf dessen Leistung testen kann. In seiner jetzigen Form wählt SiliFuzz einen Zeitpunkt, zu dem die Last auf einem bestimmten Rechner nicht zu hoch ist, und testet konsequent Gruppen von vier Threads (2 Kerne mit SMT) in nicht mehr als zwei Minuten. Zurzeit konzentrieren sich die Entwickler auf x86-64-Prozessoren, die auch von Google selbst verwendet werden.
Das Hauptziel des Projekts besteht darin, die Erkennung von versteckten Fehlern zu automatisieren, die zu Rechenfehlern führen, die viel gefährlicher sind als einfache Abstürze und Ausfälle, da nur kleine Abweichungen im Chipbetrieb zur Akkumulation einer ganzen Reihe von Fehlern führen. In einigen Fällen betrug der Unterschied weniger als 0,0000003 %, was jedoch ausreichen kann, um ernsthafte Probleme zu verursachen.
Wie effektiv ist
Etwa 45 % der von SiliFuzz entdeckten Fehler werden von anderen Tools nicht aufgespürt. Zukünftige Entwickler planen, SiliFuzz zu erweitern, die Geschwindigkeit des Programms zu erhöhen und seine Gesamtqualität zu verbessern.
Illustration: Laura Ockel auf Unsplash