Senior Site Reliability Engineer (all genders)
gridX München
Wie Du zu gridX beitragen kannst
Do stuff that matters - werde ein Teil von gridX und trage Deinen eigenen Teil dazu bei, mit uns die Energiebranche zu digitalisieren und somit erneuerbare Energien überall zugänglich und bezahlbar zu machen #getshitdone
Als Cloud Infrastructure Team schaffen wir die Grundlage des Erfolges und sichern die Skalierbarkeit - angefangen von ihrer Produktion bis zum eigenen Deployment-System, durch das wir neue Anwendungen in kürzester Zeit entwickeln und bei unseren Kund:innen ausrollen können.Über unsere größtenteils in Go entwickelten Tools machen wir anderen internen Teams, die mit der gridBox arbeiten, den Alltag leichter.
- Du bist verantwortlich für unsere kritische Cloud-Infrastruktur und verwaltest diese als Code
- Du möchtest Verantwortung tragen und die Cloud-Infrastruktur von gridX kontinuierlich verbessern
- Du erkennst potenzielle Probleme oder bottlenecks bereits im Vorfeld und bringst Deine eigenen Ideen ein, um unsere Serviceplattform belastbarer und zuverlässiger zu machen
- Du verstehst den Wert einer "Service Ownership"-Kultur
- Du unterstützt oder betreust unsere Entwickler beim zuverlässigen Betrieb ihrer Dienste in Produktion, indem Du ihnen bei der Bereitstellung ihrer Anwendungen und Interaktion mit verschiedenen Cloud-Diensten hilfst
- Du kümmerst Dich um unser internes Monitoring für unsere Anwendungen und Infrastruktur und leitest unsere Entwickler bei der Einrichtung ihrer eigenen Dashboards und Alerts an
- Du verwaltest zentrale Tools zur Unterstützung und beschleunigst unsere Entwicklung, z. B. CI/CD, Docker Base Images
- Du setzt Cloud Native Best Practices unternehmensweit durch
- Du dokumentierst alles und pflegst unsere Runbooks
- Du hast ein ausgeprägtes Bewusstsein und Erfahrung in der Arbeit mit den Prinzipien des Site Reliability Engineering
- Du weißt, wie man Hochverfügbarkeit, Skalierbarkeit und Fehlertoleranz für verteilte Software in Produktion erreicht
- Du hast Erfahrung mit Kubernetes und weißt, wie man auch größere Cluster zuverlässig betreibt
- Du bist sehr erfahren im Umgang mit IaC-Tools (z.B. Terraform, Cloudformation, CDKs; wir verwenden hauptsächlich Terraform)
- Du hast ein tiefes Verständnis für Cloud-Angebote wie AWS. Speziell AWS-Dienste wie EC2, EKS, Lambda, Kinesis, DynamoDB, SNS, IAM, RDS
- Du hast proaktive Sicherheit im Sinn und folgst Best Practices und offiziellen Benchmarks
- Du weißt, worum es bei Scratch- oder Distress-Containern geht und warum man diese in Produktion einsetzen sollte
- Du hast seit mindestens 5 Jahren Erfahrung in mindestens einer modernen Programmiersprache wie z.B. Go, Python, Java; wir verwenden hauptsächlich Go
- Du weißt, wie man durch den Einsatz von Monitoring-Lösungen wie Prometheus und Grafana die Transparenz erhöht, Dashboards optimiert und Alerts definiert
- Flexibles & mobiles Arbeiten: Arbeite bis zu 70 Tage remote aus dem gesamten EU-Ausland
- Urlaub: 30 Tage für Deine Entspannung + je 0,5 Tage Special Leave am Ende des Jahres für den 24. und 31. Dezember
- Gesundheit & Sport: 30 Euro Zuschuss zu Urban Sports Club oder E-Gym Wellpass sowie Angebote zu Betrieblichem Gesundheitsmanagement & (Mental) Health Care
- Persönliche Weiterentwicklung: Übergreifende Coachings, Zugang zu E-Learning-Plattformen & ein jährliches Development Budget von 1.500 Euro pro Mitarbeiter:in
- Mitarbeiterrabatte: Zugang zu den gridX Corporate Benefits
- Halte Dich fit und schütze die Umwelt mit unserem JobRad-Angebot
- Erhalte einen fairen und monatlichen Zuschuss zu Deiner Betrieblichen Altersvorsorge
- ÖPNV-Ticket: 30 Euro monatlicher Zuschuss zu Deinem Monats/Jahresticket in Deiner Stadt
- Moderner Arbeitsplatz im Herzen von Aachen und München mit IT-Equipment Deiner Wahl
- Jährliche Teamweek: Genieße eine unvergessliche Teamweek, stelle Dich gemeinsam mit allen gridX-Teams außergewöhnlichen Herausforderungen und schaffe unvergessliche Erinnerungen!
- Erlebe die gridX Kultur bei regelmäßig stattfindenden Teamevents und erhalte on top 100 Euro pro Mitarbeiter:in für Euer Department-Event
- Wir spenden an Deinem Geburtstag 20 Euro an eine Einrichtung Deiner Wahl
- Möglichkeit auf Sabbatical: Nimm eine Auszeit vom Arbeitsalltag und verwirkliche persönliche Projekte, Reisen oder Weiterbildungen
- Unsere Benefits weichen bei einer 100% Remote-Beschäftigung ab
Bayerische VersorgungskammerMünchen
für bestehende Prozesse
und unterstützen die Bereiche bei spezifischen Anforderungen im
Rechenzentrum.
• Sie übernehmen Aufgaben im Bereich Site Reliability Engineering und tragen zur Stabilität und Skalierbarkeit unserer
Systeme bei, einschließlich...
gridXMünchen
our runbooks
This is how you and your application stand out
• You have a strong awareness and experience of working with the principles of site reliability engineering
• You know how to achieve high availability, scalability and fault tolerance for...
GoogleMünchen
designing, analyzing, and troubleshooting distributed systems.
• Ability to debug, optimize code, and to automate routine tasks.
• Excellent problem-solving, verbal, and written communication skills.
About the job
Site Reliability Engineering (SRE)...