MENÜ MENÜ  

Fehlererkennung durch systematische Diversität in entwurfsdiversitären zeitredundanten Rechensystemen und ihr Bewertung mittels Fehlerinjektion

Tomislav Lovric

ISBN 978-3-931216-78-8
242 pages, year of publication: 1997
price: 40.00 €

Diese Arbeit untersucht fehlererkennende virtuelle Duplex-Systeme als Alternative zu herkömmlichen Duplex-Systemen. Anstatt zwei Varianten eines Anwendungsprogrammes parallel auf zwei Rechnern auszuführen, werden sie sequentiell auf einem Rechner ausgeführt d.h. strukturelle Redundanz wird durch Einsatz von Zeitredundanz vermieden. Hinsichtlich der Fehlererkennung ergibt sich als wichtigster Unterschied eine schlechtere Erkennung permanenter Hardwarefehler im virtuellen Duplex-System, sofern die Varianten nur geringe Diversität aufweisen. In diesem Fall kann sich ein permanenter Hardwarefehler auf die Ausführungen beider Varianten ähnlich auswirken und zur Berechnung identisch fehlerhafter Variantenergebnisse führen. Ein Ergebnisvergleich kann solche Fehler nicht erkennen.

Die Arbeit untersucht, inwiefern sog. systematische Diversität im virtuellen Duplex-System zur Erkennung permanenter Fehler beitragen kann. Systematische Diversität wird zusätzlich zur Entwurfsdiversität eingesetzt und bewirkt zielgerichtet eine diversitäre Nutzung der Hardware während der Ausführung der Varianten. Ein Fehler wirkt sich unterschiedlich auf beide Variantenausführungen aus und kann somit erkannt werden. Systematische Diversität erhält die Semantik der Varianten, verursacht nur unbedeutend zusätzliche Laufzeit, kann weitgehend automatisch erzeugt werden und ist unabhängig von der betrachteten Anwendung.

Verschiedene Maßnahmen der systematischen Diversität werden vorgeschlagen. Prototypen virtueller Duplex-Systeme werden gebildet und mittels Fehlerinjektion experimentell bewertet. Untersucht wird die Erkennung permanenter und transienter Hardwarefehler durch Simplex-Systeme und virtuelle Duplex-Systeme mit Entwurfsdiversität und systematischer Diversität, z.B. Übersetzerdiversität, Registerpermutation und komplementäre Bedingungen.

Weitere Themen sind die Verwendung diversitärer Prüfzeichenfunktionen zur Fehlererkennung in nicht-redundanten Teilen des virtuellen Duplex-Systems, die Tolerierung von Fehlern durch doppelte virtuelle Duplex-Systeme ohne Verwendung von Zeitredundanz im Normalbetrieb, die Entwicklung eines Prozessorfehler-Injektionswerkzeugs zur realistischen Simulation der Fehlereffekte und die Konstruktion repräsentativer Fehlerfälle.


Abstract

This work investigates fault-detecting virtual duplex-systems as an alternative to traditional duplex-systems. Instead of executing two variants of an application program in parallel on two computing nodes, they are executed sequentially on a single node, thus avoiding structural redundancy by exploiting time-redundancy. With regard to fault-detection the main difference is the reduced capability of detecting permanent hardware faults by virtual duplex-systems in the case of weak diversity between the variants. In this case, a permanent fault might similarly affect both variant executions and lead to identically wrong results. A result comparison cannot detect such faults.

The work examines to what extent so-called systematic diversity contributes to the detection of permanent faults in virtual duplex-systems. We use systematic diversity in addition to design diversity with the goal of diversifying the use of hardware during execution of the variants. In the course of this process we detect faults, since variants are affected in a different manner. Systematic diversity retains the semantics of the variants, causes only negligible execution-time overhead, can be generated almost automatically and is application-independent.

Different measures of systematic diversity are proposed in this work. Prototypes of virtual duplex-systems were built and experimentally evaluated by means of fault injection. We investigate the detection of permanent and transient faults by simplex-systems and virtual duplex-systems with design diversity and systematic diversity, e.g. compiler diversity, register permutation and complementary conditions.

Additional topics are diverse check-characters allowing fault detection in non-redundant parts of the system, fault-tolerant double virtual duplex-systems without time-redundancy during normal operation, the development of a software-implemented processor-fault injection tool allowing the realistic simulation of fault effects, and the construction of representative fault-cases.


Buying Options

40.00 €