Schwarz Digits

(Senior) Site Reliability Engineer - STACKIT Control Plane (m/w/x)

Stellenbeschreibung:

(Senior) Site Reliability Engineer - STACKIT Control Plane (m/w/x) (m/w/d)

Als erfahrener Site Reliability Engineer (SRE) bei Schwarz Digits entwickelst du die Technologieplattform für digitale Entscheidungsfreiheit in Europa. Du bist verantwortlich für die Betriebsfähigkeit der Kubernetes Control Plane und arbeitest eng mit den Entwicklungsteams zusammen, um die Zeit bis zum Erkennen von Problemen (Time-to-Detect) zu verkürzen und die Zeit bis zur Abhilfe (Time-to-Mitigation) zu optimieren.

Kurzüberblick

  • Standort: Deutschland
  • Arbeitsmodell: Hybrides Arbeitsmodell (Remote- und Präsenzarbeit)
  • Anstellungsart: Vollzeit

Aufgaben

Als SRE bei Schwarz Digits bist du verantwortlich für:

  • Die Verbesserung der Monitoring- und Alerting-Infrastruktur, um die Einhaltung der Service-Level-Objektive (SLOs) sicherzustellen
  • Die kontinuierliche Optimierung der Time-to-Mitigation durch das Erstellen klarer Playbooks, das Design von Dashboards für First Responder und die Sicherstellung umfassender Telemetriedaten (Logs und Metriken)
  • Die Rolle als Reliability Consultant für die Entwicklungsteams, um Wissen über Reliability-Patterns zu vermitteln und den „Shift Left“-Ansatz zu unterstützen
  • Die Gestaltung und Optimierung von Entwicklungsprozessen wie CI/CD-Pipelines, um Progressive-Delivery-Strategien (z. B. Canary Releases und Blue/Green Deployments) zu unterstützen und Updates sicher und risikoarm auszurollen
  • Die Analyse der Skalierbarkeit der Control Plane und die Behebung von Engpässen in Bereichen wie Distributed Consensus, Datenbank-Durchsatz und Kernel-Level-Networking
  • Die Teilnahme an einer vergüteten On-Call-Rotation, die Leitung von Incident Responses und die Moderation von Post-Mortems sowie Root Cause Analysen

Anforderungen

  • Mindestens 3 Jahre Erfahrung in Site Reliability Engineering, DevOps oder Platform Engineering
  • Expertenwissen über die Interna der Kubernetes Control Plane, einschließlich API Server, Controller Manager, Scheduler und etcd
  • Go-Sicherheit und Fähigkeit, produktionsreifen Code zu schreiben, um Automatisierungstools, Kubernetes Operatoren oder Integrations-Code zu entwickeln
  • Fundierte Erfahrung mit Infrastructure as Code und Container-Infrastrukturen sowie tiefgehende Kenntnisse in Linux-Interna (Kernel-Tuning, Memory Management) und Networking (TCP/IP, CNI, Load Balancer, eBPF)
  • Erfahrung im Betrieb von Datastores (z. B. PostgreSQL, Redis) und Messaging-Systemen (z. B. Kafka, NATS) in skalierbaren Umgebungen
  • Fähigkeit, Problemen auf den Grund zu gehen, um daraus zu lernen, und sich selbst aus dem Job zu automatisieren

Benefits

  • Hybrides Arbeitsmodell mit flexiblen Arbeitszeiten
  • Echtes Gestaltungsspielraum in deinen Projekten
  • Stabiles Fundament der Schwarz Gruppe
  • Chance zur digitalen Entscheidungsfreiheit in Europa
NOTE / HINWEIS:
EnglishEN: Please refer to Fuchsjobs for the source of your application
DeutschDE: Bitte erwähne Fuchsjobs, als Quelle Deiner Bewerbung

Stelleninformationen

  • Veröffentlichungsdatum:

    21 Jun 2026
  • Gehaltsspanne (KI-Schätzung):

    80000€ bis 120000€ p.a.
  • Standort:

    Heilbronn

    Einsatzort:

    Germany (best effort, inferred from text)
  • Typ:

    Vollzeit
  • Arbeitsmodell:

    Vor Ort
  • Kategorie:

    Development & IT
  • Erfahrung:

    Senior
  • Arbeitsverhältnis:

    Angestellt

KI Suchagent

AI job search

Möchtest über ähnliche Jobs informiert werden? Dann beauftrage jetzt den Fuchsjobs KI Suchagenten!