Combining On-Line-Test and Self-Repair for Highly Dependable Processor-based Nano-Electronic Systems
Final Report Abstract
In diesem Projekt wurde die Kombination von Online- und Offline-Methoden zur Behandlung transienter und permanenter Fehler insbesondere in eingebetteten Systemen untersucht. Die Untersuchungen wurden für statisch geplante VLIW-Prozessoren begonnen und unter Anderem auf Grund des hohen Hardwareoverheads für dynamisch geplante Prozessoren fortgesetzt. Dort konnten drei wesentliche wissenschaftliche Fortschritte erreicht werden: • Durch Kombination unterschiedlicher Online-Methoden konnte die Fehlerrate des genutzten Beispielprozessors bei transienten Fehlern auf 0% in den Simulationen reduziert werden, bei einem zusätzlichen Hardwareoverhead von nur ca. 23%. • Aussagen in früheren Arbeiten zur Fehlerrate in der Sphere-of-Replication solcher Prozessoren konnten durch genauere Simulationstechniken widerlegt werden. • Es wurde deutlich, dass bereits die integrierten online-Methoden einen guten Schutz gegen permanente Mehrfachfehler bieten, so dass die Kombination mit entsprechenden Offline- Methoden für die Zuverlässigkeit des Systems keine signifikante Steigerung bringt. Eine Kombination ist eher aus Gründen der Laufzeit in harten Echtzeitkritischen Systemen relevant. Das Prinzip der softwarebasierten Offline-Reparatur konnte auch auf Flash-Speicher erfolgreich angewendet werden. Ein wesentlicher wissenschaftlicher Fortschritt war hier das Ergebnis, dass die Fertigungsausbeute durch diese Technik ähnlich gesteigert werden konnte, wie mit klassischen hardwarebasierten Techniken, allerdings ohne den dafür typischerweise notwendigen Hardwaremehraufwand. Insbesondere die Ergebnisse zur Speicherreparatur wurden bereits in einem Demonstrator für VW überführt, haben zur Einwerbung eines kleineren Industrieauftrages geführt und waren bei der Einwerbung eines BMBF-geförderten Projektes wesentlich.
Publications
- A multi-layer software-based fault-tolerance approach for heterogenous multi-core systems. LATS 2015: 1-6
Sebastian Müller, Tobias Koal, Stefan Scharoba, Heinrich Theodor Vierhaus, Mario Schölzel
(See online at https://doi.org/10.1109/LATW.2015.7102508) - Software-based repair for memories in tiny embedded systems. ETS 2015: 1-2
Mario Schölzel, Patryk Skoncej
(See online at https://doi.org/10.1109/ETS.2015.7138766) - Softwarebasierte Fehlertolerenz für Flash-Speicher von mikrocontroller-basierten Systemen. GI-Jahrestagung 2015: 1461-1473
Patryk Skoncej, Felix Mühlbauer, Mario Schölzel
- A comprehensive software-based self-test and self-repair method for statically scheduled superscalar processors. LATS 2016: 33-38
Mario Schölzel, Tobias Koal, Sebastian Müller, Stefan Scharoba, Stephanie Roder, Heinrich Theodor Vierhaus
(See online at https://doi.org/10.1109/LATW.2016.7483336) - Feasibility of software-based repair for program memories. IOLTS 2016: 199-202
Patryk Skoncej, Felix Mühlbauer, Felix Kubicek, Lukas Schröder, Mario Schölzel
(See online at https://doi.org/10.1109/IOLTS.2016.7604699) - Handling manufacturing and aging faults with software-based techniques in tiny embedded systems. LATS 2017: 1-6
Felix Mühlbauer, Lukas Schröder, Patryk Skoncej, Mario Schölzel
(See online at https://doi.org/10.1109/LATW.2017.7906756) - Handling of permanent faults in dynamically scheduled processors. IOLTS 2017: 203-204
Felix Mühlbauer, Lukas Schröder, Mario Schölzel
(See online at https://doi.org/10.1109/IOLTS.2017.8046219) - On hardware-based fault-handling in dynamically scheduled processors. DDECS 2017: 201-206
Felix Mühlbauer, Lukas Schröder, Mario Schölzel
(See online at https://doi.org/10.1109/DDECS.2017.7934572) - A fault tolerant dynamically scheduled processor with partial permanent fault handling. LATS 2018: 1-6
Felix Mühlbauer, Lukas Schröder, Mario Schölzel
(See online at https://doi.org/10.1109/LATW.2018.8349676) - Handling of transient and permanent faults in dynamically scheduled super-scalar processors. Microelectron. Reliab. 80: 176-183 (2018)
Felix Mühlbauer, Lukas Schröder, Mario Schölzel
(See online at https://doi.org/10.1016/j.microrel.2017.11.021)