(Senior) Site Reliability Engineer - STACKIT Control Plane (m/w/d)

Stellenbeschreibung:

Wählen Sie aus, wie oft (in Tagen) Sie eine Benachrichtigung erhalten möchten:

Du willst mit uns STACKITEERs die Cloud-Welt im Sturm erobern und mit uns die Zukunft Europas gestalten? Prima! Dann bist du bei STACKIT genau richtig. Unsere Vision ist ambitioniert: Ein unabhängiges Europa - digital, führend. Als Cloud- und Colocation-Provider bauen wir die sichere Infrastruktur dafür. Mit unseren Serverstandorten ausschließlich in Deutschland und Österreich bieten wir sowohl der Schwarz Gruppe, zu der wir gehören, als auch externen Kunden eine europäische Alternative zu den internationalen Cloud-Anbietern und unterstützen unsere Kunden mit individuellen Lösungen ganzheitlich.

Als engagierter STACKITEER bist du Teil des Geschäftsbereichs STACKIT Products. Hier werden unsere Produkte und Services entwickelt, getestet und verbessert.

Als SRE für die STACKIT Control Plane gestaltest du die Systemarchitektur an der Schnittstelle von Entwicklung und Systems Engineering. Gemeinsam mit dem Entwicklungsteam entwirfst, baust und betreibst du skalierbare und zuverlässige Systeme. Deine Herausforderungen reichen von der Optimierung von Datenbanken und Messaging-Systemen bis hin zur Weiterentwicklung unserer STACKIT-Services.

Deine Aufgaben

  • Du arbeitest eng mit den Entwicklungsteams zusammen, um die “Time-to-Detect” zu verkürzen, indem du unsere Monitoring- und Alerting-Infrastruktur verbesserst und die Einhaltung der SLOs sicherstellst.
  • Deine Arbeit ist entscheidend für die kontinuierliche Optimierung der „Time-to-Mitigation“; dies erreichst du durch das Erstellen klarer Playbooks, das Design von Dashboards für First Responder und die Sicherstellung umfassender Telemetriedaten (Logs und Metriken).
  • Du agierst als Reliability Consultant für die Entwicklungsteams, vermittelst Wissen über Reliability-Patterns und unterstützt den „Shift Left“-Ansatz, um ein Modell der geteilten Verantwortung zu etablieren.
  • Du gestaltest und optimierst Entwicklungsprozesse wie CI/CD-Pipelines, um Progressive-Delivery-Strategien (z. B. Canary Releases und Blue/Green Deployments) zu unterstützen und Updates sicher und risikoarm auszurollen.
  • Du analysierst proaktiv die Skalierbarkeit der Control Plane und behebst Engpässe in Bereichen wie Distributed Consensus, Datenbank-Durchsatz und Kernel-Level-Networking.
  • Du nimmst an einer vergüteten On-Call-Rotation teil, leitest Incident Responses und moderierst Post-Mortems sowie Root Cause Analysen.

Dein Profil

  • Du bringst mehr als 3 Jahre Erfahrung in Site Reliability Engineering, DevOps oder Platform Engineering mit, wobei dein Fokus auf dem Betrieb großer verteilter Systeme in Produktionsumgebungen liegt.
  • Du besitzt Expertenwissen über die Interna der Kubernetes Control Plane, einschließlich API Server, Controller Manager, Scheduler und etcd.
  • Du beherrschst Go sicher und schreibst produktionsreifen Code, um Automatisierungstools, Kubernetes Operatoren oder Integrations-Code zu entwickeln.
  • Du verfügst über fundierte Erfahrung mit Infrastructure as Code und Container-Infrastrukturen sowie tiefgehende Kenntnisse in Linux-Interna (Kernel-Tuning, Memory Management) und Networking (TCP/IP, CNI, Load Balancer, eBPF).
  • Du bringst Erfahrung im Betrieb von Datastores (z.B. PostgreSQL, Redis) und Messaging-Systemen (z.B. Kafka, NATS) in skalierbaren Umgebungen mit.
  • Du gehst Problemen auf den Grund, um daraus zu lernen, automatisierst dich selbst aus dem Job und verlässt dich nicht auf das Prinzip Hoffnung.
#J-18808-Ljbffr
NOTE / HINWEIS:
EnglishEN: Please refer to Fuchsjobs for the source of your application
DeutschDE: Bitte erwähne Fuchsjobs, als Quelle Deiner Bewerbung

Stelleninformationen

  • Veröffentlichungsdatum:

    21 Jan 2026
  • Standort:

    Heilbronn
  • Typ:

    Vollzeit
  • Arbeitsmodell:

    Vor Ort
  • Kategorie:

  • Erfahrung:

    2+ years
  • Arbeitsverhältnis:

    Angestellt

KI Suchagent

AI job search

Möchtest über ähnliche Jobs informiert werden? Dann beauftrage jetzt den Fuchsjobs KI Suchagenten!

Diese Jobs passen zu Deiner Suche:

ProtocolHero GmbH
Tech Lead Software Engineer (m/w/d)
ProtocolHero GmbH
partner ad:img
Vollzeit Köln
22 Jan 2026Development & IT
eku Kabel & Systeme GmbH & Co. KG
Vertriebsmitarbeiter (m/w/d) im Außendienst / Sales Manager – Glasfaser- & Datennetzwerklösungen
eku Kabel & Systeme GmbH & Co. KG
partner ad:img
Vollzeit Baden-Württemberg
22 Jan 2026Development & IT
MAC Mode GmbH & Co. KGaA
Softwareentwickler (m/w/d) in Vollzeit
MAC Mode GmbH & Co. KGaA
partner ad:img
Vollzeit Wald
22 Jan 2026Development & IT
CSE Healthcare GmbH
(Senior) Full Stack Developer (m/w/d) Hannover
CSE Healthcare GmbH
partner ad:img
Vollzeit Hannover
22 Jan 2026Development & IT
Finanz Informatik GmbH & Co. KG
Red Team Penetrationstester (m/w/d)
Finanz Informatik GmbH & Co. KG
partner ad:img
Vollzeit Hannover
22 Jan 2026Development & IT
Mahlo GmbH + Co. KG
IT-Leiter (m/w/d)
Mahlo GmbH + Co. KG
partner ad:img
Vollzeit Saal/Donau
22 Jan 2026Development & IT
Finanz Informatik GmbH & Co. KG
Softwareentwickler Identity Access Management (m/w/d)
Finanz Informatik GmbH & Co. KG
partner ad:img
Vollzeit Hannover oder Münster
22 Jan 2026Development & IT
COEUR DE LION Schmuckdesign GmbH
Senior IT-Allrounder/ Mitarbeiter Anwendersupport (m/w/d)
COEUR DE LION Schmuckdesign GmbH
partner ad:img
Vollzeit Stuttgart
22 Jan 2026Development & IT