Netlution Referenzprojekt: Energieversorger
Projekt:
Realisierung einer Hochverfügbarkeit für kritische RZ Anbindung
Unternehmen:
Energieversorger
Ausgangssituation:
Der Kunde betreibt drei IP basierte Anbindungen zwischen einer Tochtergesellschaft und der Zentrale, insbesondere für SAP und CAD Anwendungen.
- 155 MBIT SDH
- VPN über 34 Mbit Internet Anbindung
- 2 Mbit Standleitung
Die Verfügbarkeit der Anbindung ist außerordentlich betriebskritisch und Gegenstand des Konzernvertrages. Zum Ausgangspunkt des Projektes wurde ausschließlich die SDH Leitung verwendet. Es gab keinerlei Verfahren für manuelle oder automatische Umschaltung auf die alternativen Anbindungen.
Projektziele:
Hauptziele:
- Realisierung eines automatischen Failovers auf die Alternativleitungen
Nebenziele:
- Nutzung des Verfahrens für andere Tochtergesellschaften mit abweichenden Anbindungsvarianten
- Diagnoseunterstützung bei Fehlern
Projektdurchführung:
Phase I: Problemanalyse und manuelle Umschaltung
Zuerst wurde eine generelle Problembeschreibung angestrebt, um die Komplexität abzuschätzen. Da eine vollautomatische Umschaltung offensichtlich nicht einfach zu realisieren war, wurde ein Konzept für eine definierte manuelle Umschaltung entwickelt.
Phase II: Studie aller möglichen automatischen Umschaltvarianten und Empfehlung
In dieser zweiten Phase wurden alle technischen Möglichkeiten für eine automatische Umschaltung untersucht:
- Routing Protokolle (OSPF, BGP)
- Failover Protokolle (VRRP, HSRP)
- Proprietäre Lösungen
- Link Balancing
- eigene Überwachungsprogramme
Die Untersuchung fand auf der Basis allgemeinen technologischen Know-hows, sowie unter Hinzuziehung von Herstellern statt. Alle Ansätze konnten zu (irgend)einer Lösung führen, jedoch in den meisten Fällen unter erheblichen Einschränkungen, z.B. bezüglich der Sicherheit, der Interoperabilität oder der Failover Zeiten.
Schlussendlich konnten zwei Alternativen empfohlen werden:
- Link Balancing
- Überwachungsprogramm
Es wurde entschieden, ein Überwachungsprogramm zu realisieren und die Lösung mit Link Balancern für einen potentiellen Einsatz zu einem späteren Zeitpunkt zu planen. Für die Lösungskonzeption mit Link Balancern wurde eng mit der Firma F5 zusammen gearbeitet.
Phase III: Realisierung des Failover Überwachungsprogramms
Das Programm wurde so konzipiert, dass es alle verfügbaren Leitungen gleichzeitig überwacht und zwar auf mehreren Ebenen. Die Ebenen stellen verschiedene Systeme in unterschiedlicher Entfernung auf dem Weg von Client zum Server dar. So kann das Programm feststellen, in welchem Umfeld der Fehler zu suchen ist.
Jede Ebene kann mehrere Systeme umfassen, damit z.B. das einfach Rebooten eines Servers nicht sofort zur Feststellung eines Fehlers führt.
Genau dann, wenn eine bestimmte kritische Ebene als defekt eingestuft wird, erfolgt ein Failover auf die Strecke mit der nächsten Präferenz. Der Failover selbst basiert auf einem individuellen anpassbaren Skript. Im vorliegenden Fall werden einfach die Routen auf den zentralen Firewalls umgestellt.
Wenn der Fehler wieder behoben ist, erfolgt ein Fallback auf die Strecke mit höherer Präferenz. Das Programm verfügt über einen eigenen VRRP ähnlichen Failover Mechanismus.
Eingesetzte Methoden, Technologien, Produkte:
- Routing Protokolle OSPF, BGB
- VRRP, HSRP, Clustering
- Objektorientierte Programmiermethoden in Perl
- Multi-Threading
Status:
Das Failover Programm ist seit Januar 2004 im Einsatz und wurde mehrfach erfolgreich vertestet. Ein Echt-Einsatz war noch nicht erforderlich.