IT-Abteilungen

IT-Verfügbarkeit sicherstellen: Systeme gezielt ausfallsicher planen

In der digitalisierten Wirtschaft ist die Verfügbarkeit von IT-Systemen längst geschäftskritisch. Ob Webshop, Cloud-Infrastruktur oder Produktionssteuerung – Ausfälle führen nicht nur zu Umsatzverlusten, sondern auch zu Image- und Vertrauensschäden.

Denn IT-Verfügbarkeit ist kein Zufallsprodukt, sondern das Ergebnis bewusster Entscheidungen: über Prioritäten, Technologien und Prozesse. Ziel dieses Artikels ist es, ein praxisnahes Verständnis für Verfügbarkeitsklassen, Ursachen von Ausfällen sowie geeignete Absicherungsmaßnahmen zu vermitteln – damit Unternehmen ihre IT-Landschaft ausfallsicher und skalierbar aufstellen können.

Was bedeutet IT-Verfügbarkeit?

IT-Verfügbarkeit beschreibt die Fähigkeit eines Systems, Dienste, Anwendungen oder Daten zu definierten Zeiten zuverlässig bereitzustellen – ohne Unterbrechungen oder unvorhergesehene Ausfälle. Sie ist damit ein zentraler Bestandteil betrieblicher IT-Strategien und eine messbare Größe im Rahmen von Service Level Agreements (SLAs), etwa durch Vorgaben wie „99,9 % Verfügbarkeit pro Jahr“.

Im Gegensatz zu anderen Aspekten der IT-Sicherheit – wie Vertraulichkeit oder Integrität – steht bei der Verfügbarkeit der Betriebszustand im Fokus. Systeme müssen nicht nur geschützt, sondern auch dauerhaft funktionsfähig sein – etwa für den Zugriff auf Cloud-Dienste, Datenbanken oder Produktionssteuerungen.

Normen wie die ISO/IEC 27001 oder Empfehlungen des BSI (Bundesamt für Sicherheit in der Informationstechnik) ordnen Verfügbarkeit als gleichrangiges Schutzziel ein. In der Praxis bedeutet das: Unternehmen müssen konkrete Maßnahmen treffen, um sicherzustellen, dass geschäftskritische Systeme auch unter Belastung, im Fehlerfall oder bei externen Störungen weiterarbeiten – oder schnell wiederhergestellt werden können.

Verfügbarkeitsklassen nach BSI: Einordnung & Praxisbezug

Nicht jede IT-Anwendung benötigt dieselbe Ausfallsicherheit – und genau hier setzen die Verfügbarkeitsklassen (VK) an, wie sie etwa in Anlehnung an BSI-Empfehlungen genutzt werden. Sie helfen dabei, Systeme risikobasiert zu klassifizieren – von unkritisch bis hochverfügbar.

Die Klassen reichen von VK1 (niedrige Anforderungen) bis VK5 (höchste Verfügbarkeit):

  • VK1: Für nicht-produktive Systeme wie Testumgebungen oder interne Tools ohne Geschäftsbezug.
  • VK3: Für zentrale Services wie E-Mail oder ERP-Systeme mit mittlerer Auswirkung bei Ausfall.
  • VK5: Für Systeme mit kritischer Funktion, z. B. in der Energieversorgung, Gesundheitswirtschaft oder industriellen Fertigung – hier zählt jede Minute Ausfallzeit.

Die Einstufung erfolgt u. a. anhand von:

  • Akzeptabler Ausfallzeit (z. B. 1 Stunde oder 5 Minuten),
  • Wiederanlaufzeiten,
  • Toleriertem Datenverlust und
  • Geschäftlicher Auswirkung bei Ausfall (Business Impact).

Ein E-Commerce-Shop könnte z. B. in VK4 eingeordnet sein, da Ausfälle zu Umsatzverlusten führen. Ein automatisiertes Steuerungssystem in der Produktion dagegen benötigt oft VK5, weil hier jede Sekunde zählt.

Diese Kategorisierung bildet die Grundlage für zielgerichtete Schutzmaßnahmen – und gehört in jede Business Impact Analysis (BIA).

Typische Ursachen für mangelnde IT-Verfügbarkeit

IT-Ausfälle sind selten das Ergebnis einer einzigen Ursache – oft wirken mehrere Faktoren gleichzeitig. Ein ganzheitliches Verständnis möglicher Schwachstellen ist daher essenziell, um systematisch gegenzusteuern.

Zu den häufigsten Ursachen zählen:

  • Technische Defekte: Dazu gehören Hardwareausfälle, fehlerhafte Speicherkomponenten, instabile Netzwerke oder Softwarefehler nach Updates.
  • Menschliche Fehler: Falsch konfigurierte Systeme, versehentlich gelöschte Daten oder unklare Verantwortlichkeiten im Incident-Management können kritische Störungen verursachen.
  • Cyberangriffe: Ransomware, DDoS-Attacken oder gezielte Sabotage führen nicht selten zu erheblichen Verfügbarkeitsproblemen – insbesondere bei unzureichend geschützten Endpunkten.
  • Externe Einflüsse: Stromausfälle, Naturereignisse (z. B. Hochwasser) oder Gebäudeschäden durch Feuer sind selten, aber schwerwiegend.

Besonders kritisch: Die Kombination mehrerer Faktoren – etwa ein fehlendes Backup in Verbindung mit einem Anwenderfehler oder einem Angriff – führt oft zu längeren Wiederherstellungszeiten und höheren Schäden.

Diese Ursachen zu kennen, ist der erste Schritt. Der zweite: die passenden technischen, organisatorischen und personellen Maßnahmen zur Absicherung.

Maßnahmen zur Erhöhung der IT-Verfügbarkeit

Hohe IT-Verfügbarkeit entsteht nicht durch Glück – sondern durch ein geplantes Zusammenspiel technischer Redundanz, organisatorischer Prozesse und gezielter Prävention. Für MSPs und IT-Teams bedeutet das: nicht nur auf Störungen reagieren, sondern sie von vornherein vermeiden oder ihre Auswirkungen minimieren.

Wichtige Maßnahmen im Überblick:

  • Redundanzkonzepte: Der Aufbau redundanter Netzwerke, Server-Cluster oder Storage-Systeme sorgt dafür, dass im Störungsfall automatisch auf Ausweichressourcen umgeschaltet wird.
  • Backup & Disaster Recovery: Regelmäßige, automatisierte Backups und ein getesteter Notfallwiederherstellungsplan (Disaster Recovery Plan) garantieren, dass Datenverluste begrenzt und Systeme schnell wiederhergestellt werden können. Lösungen wie Cove Data Protection unterstützen hier mit georedundanter Datenhaltung.
  • Monitoring & Alarme: Permanente Überwachung kritischer Systeme mit intelligenten Alerting-Mechanismen erlaubt frühzeitiges Eingreifen – idealerweise automatisiert über eine RMM- Lösung wie N‑central.
  • Regelmäßige Wartung & Updates: Geplante Wartungsfenster, Patch-Management und die proaktive Behebung bekannter Schwachstellen verringern das Risiko technischer Ausfälle.
  • Schulungen & Awareness-Programme: Mitarbeitende sind oft ungewollte Verursacher von Störungen. Regelmäßige Trainings helfen, Fehler zu vermeiden und Sicherheitsstandards zu verankern.

Praxisbeispiel: Ein Unternehmen kombiniert Virtualisierung mit geo-redundanten Rechenzentren, automatisiertem Monitoring und einem abgestimmten Notfallplan. So kann es selbst bei einem Standortausfall innerhalb von Minuten auf Ersatzsysteme umschalten – und bleibt betriebsfähig.

Diese Maßnahmen sollten nicht isoliert betrachtet werden, sondern als integriertes Gesamtkonzept, das regelmäßig geprüft und weiterentwickelt wird.

Messung & Nachweis: Wie IT-Verfügbarkeit quantifiziert wird  

Damit IT-Verfügbarkeit nicht nur ein theoretisches Ziel bleibt, muss sie messbar und überprüfbar sein. Unternehmen definieren dafür klare Kennzahlen und Zielwerte, meist im Rahmen von Service Level Agreements (SLAs).

Zentrale Verfügbarkeitskennzahlen sind:

  • Verfügbarkeitsrate (in %): Beschreibt den Anteil der Zeit, in der ein System betriebsbereit ist.
  • MTTR (Mean Time to Repair): Durchschnittliche Zeit zur Wiederherstellung nach einem Ausfall.
  • MTBF (Mean Time Between Failures): Durchschnittliche Betriebszeit zwischen zwei Ausfällen.

Beispiele für Verfügbarkeitswerte:

  • 99,0 % ≈ 87 Stunden Ausfall pro Jahr
  • 99,9 % („Three Nines“) ≈ 8,7 Stunden
  • 99,999 % („Five Nines“) ≈ ca. 5 Minuten

Je nach Verfügbarkeitsklasse variieren diese Zielwerte deutlich – VK5-Anforderungen sind mit „Five Nines“ vergleichbar, während VK1 deutlich großzügigere Toleranzen zulässt.

Zur Messung kommen häufig Monitoring-Systeme zum Einsatz, die Ausfallzeiten, Reaktionszeiten und Fehlerraten erfassen. Für MSPs bietet sich hier eine zentrale Steuerung über eine RMM-Plattform an – inklusive Auswertung, Alarmierung und SLA-Reporting.

So wird aus dem abstrakten Begriff „Verfügbarkeit“ ein konkreter, überprüfbarer Qualitätsindikator.

IT-Verfügbarkeit gezielt planen und absichern

IT-Verfügbarkeit ist kein Nebenprodukt – sie ist das Ergebnis einer strategisch geplanten, technisch abgesicherten und organisatorisch verankerten IT-Infrastruktur. Gerade in Zeiten wachsender Abhängigkeit von digitalen Prozessen entscheidet sie darüber, ob Unternehmen handlungsfähig bleiben – oder im Ernstfall Umsatz, Daten und Vertrauen verlieren.

Für MSPs und IT-Entscheider bedeutet das: Die Sicherstellung einer hohen Verfügbarkeit muss fester Bestandteil jeder IT-Strategie sein – unterstützt durch klare Verfügbarkeitsziele, abgestimmte Maßnahmen und kontinuierliches Monitoring. Eine Kombination aus Redundanz, Backup-Strategien, proaktiver Überwachung und Awareness bildet die Basis.

© N‑able Solutions ULC und N‑able Technologies Ltd. Alle Rechte vorbehalten.

Dieses Dokument dient nur zu Informationszwecken und stellt keine Rechtsberatung dar. N‑able übernimmt weder ausdrücklich noch stillschweigend Gewähr noch Haftung oder Verantwortung für Korrektheit, Vollständigkeit oder Nutzen der in diesem Dokument enthaltenen Informationen.

N-ABLE, N-CENTRAL und andere Marken und Logos von N‑able sind ausschließlich Eigentum von N‑able Solutions ULC und N‑able Technologies Ltd. Sie sind gesetzlich geschützte Marken und möglicherweise beim Patent- und Markenamt der USA und in anderen Ländern registriert oder zur Registrierung angemeldet. Alle anderen hier genannten Marken dienen ausschließlich zu Informationszwecken und sind Marken (oder registrierte Marken) der entsprechenden Unternehmen.