Site Reliability Engineer (m/w/d) Schwerpunkt Observability & Security

apartmentVersicherungen Karriere placeMünchen scheduleVollzeit calendar_month 

Für unsere Münchener Direktion suchen wir Dich als

Site Reliability Engineer (m/w/d) Schwerpunkt Observability & Security

Komm in unser 10-köpfiges DevOps-, Netzwerk- und Plattform-Team und unterstütze uns, unsere eingesetzten Technologien State-of-the-Art zu halten und uns in den Bereichen Ausfallsicherheit, Systemtransparenz und Applikationssicherheit voranzubringen!

Unser Team entwickelt skalierbare und sichere Lösungen mit einem hohen Automatisierungsgrad für die IT-Anwendungen des Münchener Vereins. Um den sicheren, stabilen und performanten Betrieb unserer modernen Anwendungsumgebung weiter zu optimieren, wollen wir unser Team um Dich erweitern.

Aufgaben

Observability, Systemtransparenz & SLA/SLO-Steuerung
  • End-to-End Monitoring: Du nutzt moderne Observability-Tools, um die Performance, Verfügbarkeit und den Zustand unserer Applikationen im Live-Betrieb transparent zu machen
  • Anomalieerkennung & Security Monitoring: Du nutzt unsere Tools, um unautorisierte Zugriffsversuche, Performance-Einbrüche oder Abweichungen im Plattform-Verhalten frühzeitig, automatisiert und proaktiv zu erkennen
  • Systemzusammenhänge verstehen: Du analysierst die komplexen Abhängigkeiten und Wechselwirkungen zwischen unseren containerisierten Anwendungen, identifizierst Engpässe und beschleunigst die Root Cause Analysis
  • Etablierung von SRE-Metriken: Du unterstützt das Team bei der Definition und Überwachung von SLIs und SLOs zur Sicherung unserer Systemqualität
SRE-driven Security & Automatisierung
  • Sichere Interkonnektivität & Secrets Management: Du sorgst für eine sichere und verschlüsselte Kommunikation zwischen unseren vernetzten Applikationen und automatisierst die sichere Bereitstellung von Zugangsdaten im laufenden Betrieb
  • Plattform-Sicherheit & Guardrails (Security as Code): Du definierst und automatisierst Sicherheitsleitplanken direkt auf Plattform-Ebene
  • Resilienz & Self-Healing: Du konzipierst und implementierst ausfallsichere Muster (z. B. Rate Limiting, Circuit Breaking) und begleitest den Entwurf von automatisierten Recovery-Prozessen
Beratung & Strategie
  • Schnittstellenfunktion (DevSecOps): Du berätst und unterstützt andere (IT-)Teams bei der ausfallsicheren Architektur, dem sicheren Deployment sowie der optimalen Überwachung neuer IT-Systeme
Profil
  • Für uns zählen vor allem Deine Fähigkeiten, nicht Dein Ausbildungshintergrund – wir wissen, dass viele Wege in die IT führen
  • Kenntnisse der folgenden Technologien erleichtern Dir den Einstieg in unser Team. Wenn Du nicht alle mitbringst – kein Problem, wir unterstützen Dich dabei, den Rest zu lernen:
  • SRE- & Security-Fokus: Erfahrung im Bereich Site Reliability Engineering (SRE), DevOps oder in der Systemadministration mit starkem Fokus auf Automatisierung, Plattform-Sicherheit und Systemzuverlässigkeit
  • Observability-Expertise: Praktische Erfahrung mit Monitoring- und APM-Tools, idealerweise Elastic APM und CheckMK
  • Modernes Stack-Verständnis: Fundiertes Verständnis von Container-Orchestrierung (OpenShift/Kubernetes) sowie Java-basierten Laufzeitumgebungen (Quarkus, RedHat EAP)
  • Automatisierung & Infrastructure as Code: Sicherer Umgang mit Versionsverwaltung (Git), Automatisierungs-Tools (Ansible) sowie grundlegendes Verständnis von CI/CD-Pipelines (GitLab CI/CD, Jenkins)
  • Programming/Scripting: Gute Kenntnisse in mindestens einer Programmier- oder Skriptsprache (z. B. Python, Go, Java oder Bash) zur Automatisierung von sich wiederholenden Aufgaben (Toil)
  • Du hast den Anspruch an Dich, proaktiv Verantwortung für Themen zu übernehmen und eigene Ideen erfolgreich mit dem Team umzusetzen
  • Du bist ein Teamplayer, der Lust hat mit seiner Erfahrung und Analysestärke unser DevOps-Team zu bereichern
  • Nicht zuletzt: Neben Deutsch sprichst Du auch fließend Meme und Gif
Wir bieten
  • Team & Arbeitsplatz
  • Unsere teameigene Slushy-Maschine (bevorzugt Waldmeister-Sirup)
  • Ein moderner Arbeitsplatz im Herzen Münchens (5 Minuten vom Hauptbahnhof)
  • Flexibilität & Vergütung
  • Flexibilität durch hybrides Arbeitsmodell mit Homeoffice und Gleitzeit
  • Ausgezeichnete Vergütung inkl. Urlaubs- und Weihnachtsgeld
  • Zahlreiche Sozialleistungen – u.a. JobRad, unsere Betriebskantine, Fahrtkostenzuschuss, betriebliche Altersvorsorge, betriebliche Krankenversicherung, Massageangebote, unsere exklusive Wohnungsbörse und vieles mehr
  • Entwicklung & Verantwortung
  • Eine spannende Aufgabe mit eigenverantwortlicher Aufgabenorganisation im Team
  • Wir ermöglichen einen großen Spielraum für Deine persönliche Entwicklung – unter anderem auch durch den Besuch von Fachkonferenzen

APGW1_DE

apartmentInstaffo GmbHplaceAschheim, 11 km von München
Stellenbeschreibung Du bist interessiert an der Stelle als System Engineer/Site Reliability Engineer (m/w/d) bei Atruvia AG ? Auf der Jobplattform Instaffo kannst du dich für diesen und weitere Jobs ohne großen Aufwand bewerben. Erstelle...
apartmentmgm technology partners GmbH von bmsplaceMünchen
Platform Engineer, Site Reliability Engineer, Kubernetes, Docker, OpenShift, CI/CD, Jenkins, Git, GitHub, Bitbucket, Java, JavaScript, Ansible, AWS, Azure, Google Cloud, Grafana, Prometheus, IT. Home Office EBND ist möglich....
check_circleNeues Jobangebot

Platform Engineer

apartmentZalionplaceMünchen
operational load and keep delivery velocity high as Zalion grows. Requirements  •  Strong experience as a Platform / DevOps / Site Reliability Engineer in product teams shipping to production.  •  Deep practical knowledge of AWS: networking, IAM, security...