Zum Hauptinhalt springen

Recovery - (Daten-/System-)Wiederherstellung

System and Data Recovery


Mit dem Begriff Datenwiederherstellung (englisch: data recovery) wird im weitesten Sinne die Erkennung und Wiederherstellung fehlerhaft übertragener Daten bezeichnet. Im engeren Sinne bedeutet dies nach einem Datenverlust die Wiederherstellung der Originaldaten eines Datenträgers mithilfe von Backup-Systemen oder Continuous Data Protection (CDP). Nach einer Störung der Datenübertragung wird ein genauer zuvor definierter Zustand bei der Recovery wiederhergestellt. Insbesondere nach dem Ausfall einer physikalischen Übertragungsleitung nutzt der Anwender Wiederaufsetzpunkte, um seine Anwendung ohne Verlust fortzusetzen.

Die Ursachen des Datenverlustes können vielfältig sein. Die physikalisch und chemisch bedingte Lebensdauer eines Datenträgers ist endlich und kann von einigen Jahren bis zu einigen Jahrzehnten reichen. Auch äußere Einwirkungen wie starke elektromagnetische Felder, mechanische Beschädigungen, Elementarschäden oder bei optischen Datenträgern auch eine starke Lichteinstrahlung können auf einem Datenträger einen Verlust beziehungsweise eine Veränderung der Daten verursachen. Unter- oder Überspannung sowie Angriffe durch Würmer und Viren können schädlich sein. Nicht zuletzt kann die Ursache im Fehlverhalten des Benutzers liegen, zum Beispiel durch versehentliches Überschreiben oder Löschen einer Datei. Die Neuinstallation eines Programms oder des Betriebssystems kann zu einer Inkonsistenz in Bezug auf die alten Daten führen (englisch: data corruption).

Zu unterscheiden ist einmal der Recovery Point Objective (RPO), der den akzeptierbaren Datenverlust meint, und der Recovery Time Objective (RTO), der das Zeitfenster meint, in dem auf die Daten nicht zugegriffen werden kann.

Bei Netzkonfigurationen und Diensten wie Video- und Audioübertragung spielen die Recovery Zeiten eine wesentliche Rolle. Die Spanning-Tree Routing-Protokolle (STP) unterstützen für den Fehlerfall zwar eine Rekonfiguration jedoch benötigt diese mit einigen Sekunden zu viel Zeit. Für Ethernet-Ringkonzepte zum Beispiel gibt es schnellere Alternativen.

image-20221209141120572

Mean Time To Recover

Mean Time To Recover ist eine wichtige Kennzahl zur Beurteilung der Verfügbarkeit eines technischen Systems oder einer Systemkomponente. Sie gibt Auskunft darüber, wie lange es durchschnittlich dauert, dieses System oder die Komponente zu reparieren und die volle Funktionstüchtigkeit wiederherzustellen. Systembetreiber versuchen die MTTR zu optimieren und sie möglichst kurz zu halten.