Zum Hauptinhalt springen

Verfügbarkeitsklassen von IT-Services - 9er System

Einstufung der Zuverlässigkeit von IT-Systemen und -Diensten - maximal tolerierbare Ausfallzeit von IT-Services - Klassifizierung von hochverfügbaren Systemen


Verfuegbarkeitsklassen

Verfügbarkeitsklassen im „9er System“

IT-Verfügbarkeitsklassen dienen dazu, die Zuverlässigkeit von IT-Systemen und -Diensten einzustufen. Sie geben an, wie lange ein System im Durchschnitt ohne Unterbrechung funktioniert. Je höher die Klasse, desto geringer ist die zulässige Ausfallzeit und desto zuverlässiger ist das System.

Kennzahlen-Steckbrief

Kennzahlen-Stammdaten

Kennzahlen-TitelIT-Operating Time (je IT-Service)
Kennzahlen-IDIT-PPI.availability-class
Kennzahlen-TypQualität-Kennzahlen
Kennzahlen-BeschreibungAb welchem Punkt ein IT-Service / IT-System als hochverfügbar anzusehen ist, wird je nach Definition der Verfügbarkeit unterschiedlich beantwortet. Eine erste Hilfe bietet die Einteilung in sogenannte Verfügbarkeitsklassen, hierfür bieten sich zwei bekannte Verfahren an. Einmal die Klassifizierung nach der Availability Environment Classification (AEC), aufgestellt von der Harvard Research Group (HRG) und eine Einteilung in Verfügbarkeitsklassen im „9er System“, basierend auf der erreichten Verfügbarkeit im Jahres- oder Monatsmittel (in Prozent), hierbei wird im Regelfall der Grad der erreichten 9en, beginnend bei 99% (Klasse 2) verwendet.
InterpretationDie maximal tolerierbare Ausfallzeit hilft dabei, die eigenen Anforderungen an ein System zu definieren und somit den erforderlichen Grad der Hochverfügbarkeit eines Systems bereits in der Planungsphase festzulegen. Die Definition von "Ausfallzeit" ist entscheidend. Es muss klar sein, welche Ereignisse als Ausfälle gelten.
Messverfahrenping, Agenten von Monitoringsystemen,
MessdatenDie Daten für diese Berechnung können aus verschiedenen Quellen stammen:
Automatische Überwachungssysteme (Monitoring-Systeme) mit Messtabellen, Log-Einträge.
Manuelle Aufzeichnungen
Protokolle von IT-Systemen. Syslog (System Logging Protocol) ist ein Standardprotokoll, das in Computernetzwerken verwendet wird, um Protokollmeldungen (Log-Meldungen) von verschiedenen Geräten und Anwendungen an einen zentralen Server zu senden.
BerechnungsmethodeVerfügbarkeit = (Gesamtzeit - Ausfallzeit) / Gesamtzeit
Maßeinheit [...]% im 9er -System
AdressatIT-Service-Stakeholder
Prozess-Stakeholder
IT-Service-Owner
Gültigkeitgemäß Vorgaben aus der Dokumentenlenkung zur Aufbewahrungsfristen.
Linkssiehe auch Ausfallszeiten, Ausfallsraten

Kennzahlen-Werte - Klassifizierung von IT-Services nach Verfügbarkeitsklassen

Die Verfügbarkeitsklasse ist ein Qualitätskriterium in Service Level Agreements (SLAs).

Kennzahlen-Werte
angestrebte ZielwertIm jeweiligen SLA vereinbart.
Toleranzbereich+/- 15%.
Die maximal tolerierbare Ausfallzeit hilft dabei, die eigenen Anforderungen an ein System zu definieren und somit den erforderlichen Grad der Hochverfügbarkeit eines Systems bereits in der Planungsphase festzulegen.
EskalationsregelIm jeweiligen SLA vereinbart.
Maßnahmen bei GrenzwertüberschreitungAktive Information an den IT-Service-Owner
Messzeitpunkte/-intervalleMonat
BetrachtungszeitraumMonat
Operationalisierungplatinus_SLA-Betriebszeiten
MessverantwortlicherIT-Servicemanager
Prozessmanager für IT-Prozess: IT-Verfügbarkeit managen

Tabelle platinus_SLA-Betriebszeiten (Bildquelle = platinus)

Verfügbarkeitsklassen (nach „9er System“)

Das 9er System

Der Einteilung der Verfügbarkeitsklassen (VK) nach diesem System liegt die maximal zulässige Dauer der Ausfallzeit in vereinbarten Zeitintervallen, im Regelfall pro Monat zu Grunde. Die Anzahl der Neunen in prozentualer Angabe der Verfügbarkeit, kennzeichnet hier die Verfügbarkeitsklasse. Nach diesem Verfahren spricht man bei 99 Prozent von einer Verfügbarkeitsklasse 2. Im Regelfall spricht man bei einer Verfügbarkeit von 99,99 Prozent (Klasse 3) oder höher von einem hochverfügbaren System.

VKVerfügbarkeitMax. Ausfallzeit pro Jahr
VK299 %< 3 Tage 15 Stunden 40 Minuten
VK399,9 %< 8 Stunden 46 Minuten
VK499,99 %< 53 Minuten --> Hochverfügbares SYSTEM
VK599,999 %< 6 Minuten --> Non-Stopp-Verfügbarkeit
VK699, 9999 %weniger als 1 Minute

Grundlage der Berechnung: 365 Tage und 24 Stunden pro Tag; die entsprechende maximale Ausfallzeit ist aufgerundet.

Das 9er System des BSI

Erwähnenswert ist zudem die Klassifizierung des BSI (Bundesamt für Sicherheit in der Informationstechnik), dass auf einem 9er-System beruht, jedoch zur besseren Abgrenzung verschiedener Szenarien die Verfügbarkeitsklasse 0 hinzugefügt hat. Wie beim klassischen 9er-System, dienen auch beim System des BSI die Neunen als Unterscheidungsmerkmal. Allerdings ergibt sich durch die Hinzunahme der Verfügbarkeitsklasse 0 eine Verschiebung im Vergleich zum klassischen 9er-System und es ist nicht mehr die tatsächliche Anzahl der Neunen ausschlaggebend für die Nummerierung der Verfügbarkeitsklasse. Da das BSI-System als Mindeststandard für alle Rechenzentren des Bundes gilt, wird dieser ebenfalls häufig in der Privatwirtschaft angewendet, um Verfügbarkeiten entsprechend zu Klassifizieren.

VKVerfügbarkeitMax. Ausfallzeit pro Jahr
VK-0Ohne zugesicherte VerfügbarkeitBest Effort
VK-199,0 %< 3 Tage 15 Stunden 40 Minuten
VK-299,9 %< 8 Stunden 46 Minuten
VK-399,99 %< 53 Minuten --> Hochverfügbares SYSTEM
VK-499,999 %< 6 Minuten --> Non-Stopp-Verfügbarkeit
VK-5Disaster TolerantFunktion muss unter allen Umständen gewährleistet sein.

bei 7 x 24 Std. Betriebszeit der IT-Services.

Availability Environment Classification (AEC)

Die Harvard Research Group klassifiziert die Hochverfügbarkeit in der Availability Environment Classification (AEC). Sechs Klassen (AEC-0 bis AEC-5) ermöglichen dabei eine transparente und schnelle Zuordnung der Anforderungen an einzelne Komponenten oder ein ganzes System.

HRG-KlasseBezeichnungErklärung
AEC-0ConventionalFunktion darf unterbrochen werden und Datenintegrität ist nicht essentiell
AEC-1Highly ReliableFunktion darf zwar unterbrochen werden, die Datenintegrität muss jedoch immer gewährleistet sein
AEC-2High AvailabilityFunktion darf zur Hauptbetriebszeit nur minimal oder innerhalb festgelegter Zeiten unterbrochen werden
AEC-3Fault ResilientFunktion darf maximal außerhalb festgelegter Betriebszeiten / Hauptbetriebszeiten unterbrochen werden.
AEC-4Fault TolerantFunktion muss jederzeit aufrechterhalten werden, 24/7-Betrieb (24 Stunden, 7 Tage die Woche).
AEC-5Disaster TolerantFunktion muss auch unter ungewöhnlichen Umständen (z.B. im Katastrophenfall) gewährleistet sein

Kennzahlen-Darstellung

ParameterBeschreibung
Kennzahlen-
visualisierung
Kalender mit Tagesansicht und 24h Kacheln.
Availability-Timetable
AggregationsstufeJahr-Quartal-Monate.
Kennzahlen–BerichterstatterProzessmanager, Servicemanager
Kennzahlen–BerichtsablageOnline-Auswertungen im Monitoring-System
Auswertungen im Service-HUB