Verfügbarkeitsklassen von IT-Services - 9er System
Einstufung der Zuverlässigkeit von IT-Systemen und -Diensten - maximal tolerierbare Ausfallzeit von IT-Services - Klassifizierung von hochverfügbaren Systemen
IT-Verfügbarkeitsklassen dienen dazu, die Zuverlässigkeit von IT-Systemen und -Diensten einzustufen. Sie geben an, wie lange ein System im Durchschnitt ohne Unterbrechung funktioniert. Je höher die Klasse, desto geringer ist die zulässige Ausfallzeit und desto zuverlässiger ist das System.
Kennzahlen-Steckbrief
Kennzahlen-Stammdaten
Kennzahlen-Titel | IT-Operating Time (je IT-Service) |
---|---|
Kennzahlen-ID | IT-PPI.availability-class |
Kennzahlen-Typ | Qualität-Kennzahlen |
Kennzahlen-Beschreibung | Ab welchem Punkt ein IT-Service / IT-System als hochverfügbar anzusehen ist, wird je nach Definition der Verfügbarkeit unterschiedlich beantwortet. Eine erste Hilfe bietet die Einteilung in sogenannte Verfügbarkeitsklassen, hierfür bieten sich zwei bekannte Verfahren an. Einmal die Klassifizierung nach der Availability Environment Classification (AEC), aufgestellt von der Harvard Research Group (HRG) und eine Einteilung in Verfügbarkeitsklassen im „9er System“, basierend auf der erreichten Verfügbarkeit im Jahres- oder Monatsmittel (in Prozent), hierbei wird im Regelfall der Grad der erreichten 9en, beginnend bei 99% (Klasse 2) verwendet. |
Interpretation | Die maximal tolerierbare Ausfallzeit hilft dabei, die eigenen Anforderungen an ein System zu definieren und somit den erforderlichen Grad der Hochverfügbarkeit eines Systems bereits in der Planungsphase festzulegen. Die Definition von "Ausfallzeit" ist entscheidend. Es muss klar sein, welche Ereignisse als Ausfälle gelten. |
Messverfahren | ping, Agenten von Monitoringsystemen, |
Messdaten | Die Daten für diese Berechnung können aus verschiedenen Quellen stammen: Automatische Überwachungssysteme (Monitoring-Systeme) mit Messtabellen, Log-Einträge. Manuelle Aufzeichnungen Protokolle von IT-Systemen. Syslog (System Logging Protocol) ist ein Standardprotokoll, das in Computernetzwerken verwendet wird, um Protokollmeldungen (Log-Meldungen) von verschiedenen Geräten und Anwendungen an einen zentralen Server zu senden. |
Berechnungsmethode | Verfügbarkeit = (Gesamtzeit - Ausfallzeit) / Gesamtzeit |
Maßeinheit [...] | % im 9er -System |
Adressat | IT-Service-Stakeholder Prozess-Stakeholder IT-Service-Owner |
Gültigkeit | gemäß Vorgaben aus der Dokumentenlenkung zur Aufbewahrungsfristen. |
Links | siehe auch Ausfallszeiten, Ausfallsraten |
Kennzahlen-Werte - Klassifizierung von IT-Services nach Verfügbarkeitsklassen
Die Verfügbarkeitsklasse ist ein Qualitätskriterium in Service Level Agreements (SLAs).
Kennzahlen-Werte | |
---|---|
angestrebte Zielwert | Im jeweiligen SLA vereinbart. |
Toleranzbereich | +/- 15%. Die maximal tolerierbare Ausfallzeit hilft dabei, die eigenen Anforderungen an ein System zu definieren und somit den erforderlichen Grad der Hochverfügbarkeit eines Systems bereits in der Planungsphase festzulegen. |
Eskalationsregel | Im jeweiligen SLA vereinbart. |
Maßnahmen bei Grenzwertüberschreitung | Aktive Information an den IT-Service-Owner |
Messzeitpunkte/-intervalle | Monat |
Betrachtungszeitraum | Monat |
Operationalisierung | ![]() |
Messverantwortlicher | IT-Servicemanager Prozessmanager für IT-Prozess: IT-Verfügbarkeit managen |
Tabelle platinus_SLA-Betriebszeiten (Bildquelle = platinus)
Verfügbarkeitsklassen (nach „9er System“)
Das 9er System
Der Einteilung der Verfügbarkeitsklassen (VK) nach diesem System liegt die maximal zulässige Dauer der Ausfallzeit in vereinbarten Zeitintervallen, im Regelfall pro Monat zu Grunde. Die Anzahl der Neunen in prozentualer Angabe der Verfügbarkeit, kennzeichnet hier die Verfügbarkeitsklasse. Nach diesem Verfahren spricht man bei 99 Prozent von einer Verfügbarkeitsklasse 2. Im Regelfall spricht man bei einer Verfügbarkeit von 99,99 Prozent (Klasse 3) oder höher von einem hochverfügbaren System.
VK | Verfügbarkeit | Max. Ausfallzeit pro Jahr |
---|---|---|
VK2 | 99 % | < 3 Tage 15 Stunden 40 Minuten |
VK3 | 99,9 % | < 8 Stunden 46 Minuten |
VK4 | 99,99 % | < 53 Minuten --> Hochverfügbares SYSTEM |
VK5 | 99,999 % | < 6 Minuten --> Non-Stopp-Verfügbarkeit |
VK6 | 99, 9999 % | weniger als 1 Minute |
Grundlage der Berechnung: 365 Tage und 24 Stunden pro Tag; die entsprechende maximale Ausfallzeit ist aufgerundet.
Das 9er System des BSI
Erwähnenswert ist zudem die Klassifizierung des BSI (Bundesamt für Sicherheit in der Informationstechnik), dass auf einem 9er-System beruht, jedoch zur besseren Abgrenzung verschiedener Szenarien die Verfügbarkeitsklasse 0 hinzugefügt hat. Wie beim klassischen 9er-System, dienen auch beim System des BSI die Neunen als Unterscheidungsmerkmal. Allerdings ergibt sich durch die Hinzunahme der Verfügbarkeitsklasse 0 eine Verschiebung im Vergleich zum klassischen 9er-System und es ist nicht mehr die tatsächliche Anzahl der Neunen ausschlaggebend für die Nummerierung der Verfügbarkeitsklasse. Da das BSI-System als Mindeststandard für alle Rechenzentren des Bundes gilt, wird dieser ebenfalls häufig in der Privatwirtschaft angewendet, um Verfügbarkeiten entsprechend zu Klassifizieren.
VK | Verfügbarkeit | Max. Ausfallzeit pro Jahr |
---|---|---|
VK-0 | Ohne zugesicherte Verfügbarkeit | Best Effort |
VK-1 | 99,0 % | < 3 Tage 15 Stunden 40 Minuten |
VK-2 | 99,9 % | < 8 Stunden 46 Minuten |
VK-3 | 99,99 % | < 53 Minuten --> Hochverfügbares SYSTEM |
VK-4 | 99,999 % | < 6 Minuten --> Non-Stopp-Verfügbarkeit |
VK-5 | Disaster Tolerant | Funktion muss unter allen Umständen gewährleistet sein. |
bei 7 x 24 Std. Betriebszeit der IT-Services.
Availability Environment Classification (AEC)
Die Harvard Research Group klassifiziert die Hochverfügbarkeit in der Availability Environment Classification (AEC). Sechs Klassen (AEC-0 bis AEC-5) ermöglichen dabei eine transparente und schnelle Zuordnung der Anforderungen an einzelne Komponenten oder ein ganzes System.
HRG-Klasse | Bezeichnung | Erklärung |
---|---|---|
AEC-0 | Conventional | Funktion darf unterbrochen werden und Datenintegrität ist nicht essentiell |
AEC-1 | Highly Reliable | Funktion darf zwar unterbrochen werden, die Datenintegrität muss jedoch immer gewährleistet sein |
AEC-2 | High Availability | Funktion darf zur Hauptbetriebszeit nur minimal oder innerhalb festgelegter Zeiten unterbrochen werden |
AEC-3 | Fault Resilient | Funktion darf maximal außerhalb festgelegter Betriebszeiten / Hauptbetriebszeiten unterbrochen werden. |
AEC-4 | Fault Tolerant | Funktion muss jederzeit aufrechterhalten werden, 24/7-Betrieb (24 Stunden, 7 Tage die Woche). |
AEC-5 | Disaster Tolerant | Funktion muss auch unter ungewöhnlichen Umständen (z.B. im Katastrophenfall) gewährleistet sein |
Kennzahlen-Darstellung
Parameter | Beschreibung |
---|---|
Kennzahlen- visualisierung | Kalender mit Tagesansicht und 24h Kacheln. ![]() |
Aggregationsstufe | Jahr-Quartal-Monate. |
Kennzahlen–Berichterstatter | Prozessmanager, Servicemanager |
Kennzahlen–Berichtsablage | Online-Auswertungen im Monitoring-System Auswertungen im Service-HUB |