Wiederherstellungszeitziel - Recovery Time Objective
Kennzahlen für den Aufbau einer effektiven Geschäftskontinuitätsplanung und Notfallwiederherstellungsstrategie
::: info RTO
Das Wiederherstellungszeitziel (RTO) gibt an, wie lange ein Unternehmen tolerieren kann, dass ein kritischer Geschäftsprozess oder eine IT-Dienst ausfällt, bevor erhebliche Schäden entstehen. Das RTO definiert, wie schnell ein Unternehmen nach einem Datenverlust oder einer Systemstörung wieder arbeitsfähig sein muss.
:::
Immer betriebsbereit und verfügbar zu sein, ist das Ziel vieler IT-Services. Die Widerstandsfähigkeit gegen Ausfälle ist ein Schlüsselelement des betrieblichen Geschäftskontinuitäts- und Notfallwiederherstellungsplans. Dabei geht es darum, die betroffenen Dienste möglichst schnell, effektiv und ohne größere Datenverluste oder Beeinträchtigung der Nutzer wieder betriebsbereit zu machen.
Der Datenspeicher spielt eine wichtige Rolle für die Verfügbarkeit und die Performance der Anwendungen. Speicherbezogene Ausfallzeiten beeinträchtigen den Zugriff auf Anwendungen und damit die Geschäftskontinuität. Die drei grundsätzlichen Kennzahlen lauten:
- Recovery point objective (RPO)
- Recovery time objective (RTO)
- Recovery time actual (RTA)
Recovery Point Objective
::: info RPO
Das RPO gibt an, wie viel Datenverlust ein Unternehmen tolerieren kann.
:::
Ein niedriges RPO erfordert häufig ein hohes RTO, da die Daten schnell wiederhergestellt werden müssen, um den Geschäftsbetrieb fortsetzen zu können.
Stellen Sie sich einen betriebsweiten Zwischenfall vor, bei dem der gesamte Datenspeicher ausfällt und viele Anwendungen betroffen sind. Hier versteht sich RPO als der Zeitraum des Datenverlusts der Anwendungen. Anders ausgedrückt: Der Zeitraum zwischen dem letzten zugreifbaren Datenstand und dem Schadenseintritt. RPO kann als Service-Level-Ziel oder als Kennzahl für die Verlusttoleranz verstanden werden. Welchen Zeitraum mit Datenverlusten kann ein Unternehmen realistisch betrachtet verkraften, wenn ein Speicherausfall den Zugriff auf die Daten beeinträchtigt? Wenn der RPO-Wert im Geschäftskontinuitätsplan als Zeitraum von 24 Stunden festgelegt wird und das letzte bekannte verfügbare Daten-Backup vor dem Ausfall neun Stunden zurückliegt, wird die RPO-Schwelle nicht überschritten.
Recovery Time Objective
RTO ist ein weiteres Service-Level-Ziel, das dazu dient, die von der IT-Abteilung erwartete Zielvorgabe für die Wiederherstellung der Betriebsbereitschaft festzulegen. RTO bezeichnet den Zeitraum, den das Unternehmen als Service-Level festgelegt hat und in dem der betroffene Service nach der Störung (in unserem Fall ein Speicherproblem) wiederhergestellt sein muss.
Recovery Time Actual
RTA bezieht sich auf die Zeit, die tatsächlich vergeht, bis die Daten vollständig wiederhergestellt sind und die Speicherkopie für die Anwendungen zugänglich ist. Während RTO ein Sollwert ist, der als Ziel festgelegt wird, ist RTA die tatsächlich benötigte Zeit.
Klassifizierung von IT-Services nach RTO
Es gibt keine standardisierten, universell gültigen "Level" für das Wiederherstellungszeitziel (RTO). Der RTO ist ein maßgeschneiderter Wert, der für jedes Unternehmen und jede Anwendung individuell festgelegt wird und von zahlreichen Faktoren abhängt, wie der Art des Geschäfts, der Kritikalität der Anwendung und den finanziellen Auswirkungen eines Ausfalls.
Allerdings können wir RTO-Werte in groben Kategorien einteilen, um ein besseres Verständnis zu vermitteln:
-
RTO-L3 - Sekunden bis Minuten:
- Kritische Anwendungen: Finanztransaktionen, E-Commerce, Echtzeit-Kommunikationssysteme.
- Begründung: Auch kurze Ausfälle können erhebliche finanzielle Verluste verursachen und den Ruf des Unternehmens schädigen.
-
RTO-L2 - Minuten bis Stunden:
- Wichtige Geschäftsprozesse: Produktionssteuerung, Kundenbetreuung, E-Mail-Kommunikation.
- Begründung: Ausfälle in diesem Bereich können zu Produktivitätsverlusten und Kundenunzufriedenheit führen.
-
RTO-L1 - Stunden bis Tage:
- Nicht-kritische Anwendungen: Berichte, Analysen, Entwicklungssysteme.
- Begründung: Ausfälle dieser Systeme haben in der Regel weniger gravierende Auswirkungen auf den Geschäftsbetrieb.
-
RTO-L0 - Tage bis Wochen:
- Nicht-kritische Anwendungen: Berichte, Analysen, Entwicklungssysteme.
Faktoren, die das RTO beeinflussen
- Kritikalität der Anwendung: Je kritischer eine Anwendung für den Geschäftsbetrieb ist, desto niedriger sollte das RTO sein.
- Geschäftliche Auswirkungen: Wie stark wirkt sich ein Datenverlust auf den Umsatz, die Kundenbindung und den Ruf des Unternehmens aus?
- Kosten eines Ausfalls: Die finanziellen Folgen eines Ausfalls beeinflussen die Höhe des RTO.
- Compliance-Anforderungen: Gesetzliche Vorschriften können das RTO vorgeben.
- Technische Möglichkeiten: Die verfügbare Technologie bestimmt, wie schnell eine Wiederherstellung möglich ist. Welche technischen Lösungen stehen zur Verfügung, um häufigere Backups zu erstellen?
- Kosten der Wiederherstellung: Die Kosten für die Implementierung von Wiederherstellungslösungen sind ebenfalls zu berücksichtigen.
- Toleranz der Benutzer: Wie viel Datenverlust können die Benutzer tolerieren?
Klassifizierung von IT-Services nach RPO
Es gibt keine standardisierten, universell gültigen "Level" für das Recovery Point Objective (RPO). Das RPO ist ein maßgeschneiderter Wert, der für jedes Unternehmen und jede Anwendung individuell festgelegt wird und von zahlreichen Faktoren abhängt, wie der Art des Geschäfts, der Kritikalität der Anwendung und den finanziellen Auswirkungen eines Datenverlusts.