Für unseren Kunden sind wir auf der Suche nach einem GitOps Experten (m/w/d) für das folgende Umfeld.
Laufzeit: 1.4.25 - 31.3.26
Auslastung: Full
Einsatzort: Remote, innerhalb EU
Scope:
Der Kunde betreibt eine umfangreiche Private und Public Cloud Infrastruktur, hierzu zählen ein eigens betriebener Sync & Share Service, ein hochverfügbarer und hochskalierbarer S3/Objektspeicher, sowie ein Infrastructure-as-a-Service (IaaS) Cloud-Dienst (auf der Basis von Apache CloudStack).
Zu den Public Cloud Services zählen neben den Hyperscaler-Angeboten im Bereich IaaS und PaaS auch die Bereitstellung von Microsoft 365 Service für den Kunden, sowie das darauf basierende KI-Chatbot “FhGenie”.
Für die Weiterentwicklung und Qualitätssicherung sowie Betrieb der neuen GitOps Container-Dienste Plattform in der Private Cloud basierend auf Rancher und Kubernetes besteht Bedarf an entsprechenden IT-Dienstleistungen.
Zielsetzung:
Um Qualitätsverbesserungen zu forcieren, die Weiterentwicklung im Rahmen von Minor Releases voranzutreiben und den Betrieb zu stärken, soll auch externe IT-Unterstützung hinsichtlich der Bearbeitung einzelner Arbeitspakete für die Leistungserbringung genutzt werden.
Die GitOps Infrastruktur-Landschaft basiert auf einer Architektur mit einem Management- und ca. 5-10 Downstream Clustern, vCenter/NetApp als Backend, mit zunehmender Anzahl produktiver Workloads. Es gibt Test- und Produktivsysteme. Im Einsatz sind weiterhin HashiCorp Vault, Kyverno, Palo Alto, efficientIP sowie ACME.
Der Continous Delivery Prozess findet mit Hilfe von GitLab CI/CD und ArgoCD statt, mit GitLab Docker-Runnern und Packer, Terraform- sowie Ansible-Komponenten.
Skills (müssen jeweils abgedeckt sein):
- vCenter
- NetApp
- Palo Alto
- efficientIP
Tätigkeiten:
Arbeitspaket 1: Aufbau von Logging- und Monitoring-Grundstrukturen
1. Tätigkeiten/Arbeitsschritte
o Analyse der bestehenden Plattform und Anforderungen an Observability (z. B.Definition notwendiger KPIs).
o Konzeption und Planung eines skalierbaren Logging- und Monitoring-Grundgerüsts.
o Integration der bestehenden GitOps-Prozesse für automatisierten Rollout vonMonitoring-/Logging-Komponenten.
o Implementierung der Konfigurationen und Dashboards für das zentrale Monitoring.
o Test der Erfassung von System-, Anwendungs- und Netzwerk-Logs in Test- undProduktivumgebungen.
o Dokumentation der implementierten Lösungen, Übergabe ans Betriebsteam.
2. Benötigte Kompetenzen
o Fundierte Erfahrung mit Kubernetes- und Container-Integrationen.
o Expertise im Bereich Observability (z. B. Logging-, Monitoring-Konzepte) und GitOps.
o Verständnis von Infrastruktur-Lifecycle und Cloud-nativen Plattformen.
3. Geschätzter Aufwand (ca. 400 Stunden)
o Analyse & Konzeption
o Implementierung & Konfiguration
o Test & Qualitätssicherung
o Dokumentation & Wissenstransfer
Arbeitspaket 2: Skalierung und Hochverfügbarkeit von Logging & Monitoring
1. Tätigkeiten/Arbeitsschritte
o Evaluierung global verteilter Architekturen und Redundanzmechanismen für Observability.
o Ausarbeitung eines skalierbaren Clustering-Konzepts für die Logging- und Monitoring-Services.
o Implementierung von Lastverteilung und automatischen Failover-Konfigurationen.
o Einrichtung von Alarmierung und automatisierten Recovery-Prozessen.
o Durchführung von Load- und Stresstests zur Evaluierung der Hochverfügbarkeitsmechanismen.
o Dokumentation und Übergabe an Betrieb/Support (inkl. Eskalationspläne).
2. Benötigte Kompetenzen
o Tiefe Kenntnisse über Kubernetes-Cluster-Architekturen und Skalierung.
o Erfahrungen mit verteilten Log- und Monitoring-Systemen.
o Expertise in GitOps-gesteuerten Rollouts und automatisierten Konfigurationsänderungen.
3. Geschätzter Aufwand (ca. 400 Stunden)
o Analyse & Architekturplanung
o Implementierung & HA-Konfigurationen
o Tests (Load, Failover), Qualitätssicherung
o Dokumentation & Betriebskonzept
Arbeitspaket 3: Rapid GitOps Prototyping mit Netzwerk-Betriebsteams
1. Tätigkeiten/Arbeitsschritte
o Gemeinsame Workshops mit Netzwerk- und Infrastruktur-Teams zur Abstimmung georedundanter Anforderungen.
o Aufbau eines minimalen GitOps-Prototyps zur automatisierten Cluster-Erstellung. und -Synchronisierung über mehrere Standorte hinweg.
o Entwicklung eines verbindlichen Konfigurationsmodells für Netzwerk-, Security- und Cluster-Policies.
o Test und Validierung der Prototypen (z. B. Failover-Szenarien, Synchronisationszeiten).
o Dokumentation der Ergebnisse, Empfehlung einer finalen Betriebsstrategie.
2. Benötigte Kompetenzen
o Fortgeschrittene Kenntnisse in GitOps-Prinzipien, Kubernetes Multi-Cluster-Management und verteilten Architekturen.
o Erfahrung in Zusammenarbeit mit Netzwerk-Teams (z. B. bei Firewall-Policies und Routing).
o Beratungskompetenz, um Anforderungen innerhalb interdisziplinärer Teams zu moderieren.
3. Geschätzter Aufwand (ca. 600 Stunden)
o Analyse & Workshop-Konzeption
o Prototypische Implementierung & GitOps-Aufbau
o Test & Abstimmung mit anderen Teams
o Dokumentation & Präsentation
Arbeitspaket 4: Backup-Realisierung im georedundanten Umfeld
1. Tätigkeiten/Arbeitsschritte
o Analyse der aktuellen Datensicherungsprozesse und Anforderungen (z. B. Recovery Point/Time Objectives).
o Erstellung eines Konzepts für Backup- und Restore-Prozesse, abgestimmt auf verteilte Kubernetes-Cluster.
o Implementierung automatisierter Backup-Jobs und Integration in das GitOps-Ökosystem.
o Test von Disaster-Recovery-Szenarien (inkl. Cross-Cluster-Restore).
o Finalisierung und Dokumentation des Backup-Prozesses inkl. Wartungs- und Lifecycle-Konzept.
2. Benötigte Kompetenzen
o Erfahrung in Container-basierten Backup-/Restore-Strategien und verteilten Systemen.
o GitOps-Know-how für das automatisierte Ausrollen von Sicherungskomponenten.
o Kenntnisse zu Geo-Redundanz und Failover-Mechanismen.
3. Geschätzter Aufwand (ca. 400 Stunden)
o Anforderungsanalyse & Konzeptentwicklung
o Implementierung & Automatisierung
o Tests (DR-Szenarien), Qualitätssicherung
o Dokumentation & Übergabe