Kurzbeschreibung:

Im Managed Service stellen wir den fehlerfreien Betrieb der Applikation sicher, die das weltweite zentrale Compliancemonitoring und Patchmanagement steuert. Diese Automatisierungslösung ermöglicht es, Konfigurationsänderungen an einer Vielzahl von Servern global einheitlich auszurollen.
Der Managed Service arbeitet hierbei mit vielfältigen Schnittstellen und Partnern innerhalb des Konzerns und der Tochterunternehmen zusammen.

Situation:

Der Kunde möchte mittels seiner Server Automation Lösung eine einheitliche Verwaltung und Betrieb seiner globalen Infrastruktur (mehr als 150.000 Server) sicherstellen. Zur initialen Einführung bestanden bereits mehrere Landschaften in Betrieb, die aus diversen Gründen voneinander unabhängig aufgebaut sind.
Die einheitliche Lösung wurde als strategisches Produkt eingeführt, und im Laufe der Jahre wurden weitere Features, über die übliche Serverautomatisierung hinausgehend, hinzugefügt und der Funktionsumfang für die Endkunden durchgehend erweitert.

Hierzu gehört im Speziellen die Anfertigung von tagesaktuellen Reports hinsichtlich Configuration und Patch Compliance, aber auch kundenspezifische Fach-Reports, die den Server Management Teams des Kunden helfen, ihre Aufgaben zu erfüllen und spezifische Anforderungen, beispielsweise SOX- und andere Audits zu erstellen.

Außerdem wird die Lösung von diversen Teams für die Patch-Installation verwendet, und bietet ebenfalls die Möglichkeit, per „Auto-Remediation“ Sicherheitslücken in der Konfiguration von Services und Anwendungen ohne weitere Nutzerinteraktion zu beheben. Diese Remediation kann hierbei speziell auf die Anforderungen des Kundenteams angepasst werden, und diverse Richtlinien seitens Sicherheit und allgemeiner Standards berücksichtigen

Kundenwunsch:

Ziel des Projektes war es, die bestehende, globale Server Automation Lösung zu konsolidieren & optimieren und diese im Anschluss als Managed Services eigenverantwortlich unter Sicherstellung der SLA zu betreiben.

  • Erhöhung und Reporting der Compliance auf Infrastruktur-, Datenbank-, und Anwendungsebene
  • Automatische Erkennung und – nach Kundenwunsch – Behebung von Schwachstellen durch den optimalen Einsatz von BladeLogic
  • Consulting im Servermanagement / Weiterentwicklung der zum Betrieb notwendigen Infrastruktur
  • Übernahme von dediziertem Support und Rufbereitschaft für Benutzer der Automatisierungslösung zur Unterstützung außerhalb der üblichen Servicezeiten

Herausforderung:

  • Entwicklung von Compliance-Prüfungen
    • Konfigurationscompliance auf OS-, Datenbank- und Anwendungsebene
    • Generelle Security Compliance
  • Bereitstellung von on Demand Scanning
    • Erstellung und Weiterentwicklung einer SOAP-Schnittstelle zur Anbindung und Interaktion mit externen Systemen
  • Definition und Erstellung von Schnittstellen zu verschiedenen CMDB und Reportingsystemen
  • Automatisierung von Infrastrukturbetrieb
    • Unterstützung beim Anlegen von Patchjobs und spezifischem Reporting
    • Unterstützung bei der Erstellung von gezielten Reports und Analysen über eine Vielzahl von Servern und Infrastrukturbetreibern, inkl. Hyperscaler
  • Consulting im Bereich Prozessdesign
    • Optimierung der internen Prozessabläufe
    • Design und Implementierung von hochautomatisierten Abläufen innerhalb der Serverautomatisierung
    • Beratung bei der Überarbeitung kundenseitiger Prozessabläufe
  • Weiterentwicklung der Server Automatisierungslösung
    • Einbindung neuer Kunden
    • Ganzheitliche Anforderungsanalyse und anschließende Umsetzung
  • Stabiler Servicebetrieb /- Kontinuierliche Optimierung durch Automatisierung

Hierzu wurde der Service zunächst analysiert und im Rahmen einer Transition Phase als Managed Service übernommen. Neben den Betrieb der Umgebungen, verantwortet Netlution die Weiterentwicklung der Landschaften, die Durchführung bzw. Überwachung der Compliance-Checks sowie die Durchführung der Auto-Remediations als auch die Stabilisierung und Verbesserung der eigentlichen Umgebungen. Auch neue Umgebungen werden aufgebaut und in den Service integriert.

KPI:

  • Sicherstellung des sicheren Betriebs der Kundeninfrastruktur durch Monitoring der >150.000 Server
  • Sicherstellung des BladeLogic Applikationsbetriebs (global ca. 100 Server in mehreren Landschaften)
  • Nachhaltige Erhöhung der Configuration Compliance dank automatischer Überwachung, Reporting und Remediation
  • Behebung von mehr als 550 Incidents in den letzten 12 Monaten
  • Unterstützung in ca. 700 Service Requests im gleichen Zeitraum
  • Durchschnittliche Reaktion innerhalb 30 Minuten innerhalb der Rufbereitschaft

Eingesetzte Technologien:

  • BladeLogic / TrueSight Server Automation (Versionen 8.x bis 21.02)
    • > 10 operativ genutzte Landschaften, ca. 100 Applikations- und verknüpfte Server
  • Scripting
    • Windows PowerShell
    • BaSH, KSH, NSH
    • Python
    • BLCLI
    • C# (SOAP-Schnittstelle)
  • MS SQL und Fileserver im Failover Cluster
  • SLES als Repository-Server

Netlution Lösung:

  • Managed Service im 5×11 Betrieb
  • Sicherstellung des durchgängigen Betriebs durch Rollierendes Einsatzsystem inklusive Vor-Ort-Einsätzen beim Kunden und Remote-Erbringung
  • Etablieren eines Servicemanagement und kontinuierlichen Reportings an unseren Kunden
  • Enge Zusammenarbeit im Projektrahmen und bei der kontinuierlichen Serviceverbesserung

Projektlaufzeit:

Der Managed Service inkl. Transition startete 2016 und endet im Juni 2021.

Netlution Leistungen:

  • Operativer Support aller BladeLogic Landschaften gegenüber den Endbenutzern
  • Konfiguration und Einbindung neuer Landschaften
  • Betrieb der BladeLogic Landschaften (inkl. Patching, Compliancebetreuung und Fehlerbehebung)
  • Betreuung der Datenbankinfrastruktur (inkl. Fehlerbehebung)
  • Erstellung und Betreuung von BladeLogic Jobs, Paketen und Templates
  • Vollständiges rollenbasiertes Usermanagement
  • Entwicklung und Betreuung eigener und kundenspezifischer Skripte zur Erfüllung neuer Anforderungen