Informations importantes Ce rôle hybride basé à notre bureau de SAP Montréal requiert 3 présences au bureau par semaine. Les candidats doivent avoir le droit de travailler légalement au Canada au moment de la soumission de la candidature. Ce poste n’est pas admissible au parrainage par l’employeur (p. ex., LMIA ou autre soutien à l’immigration). Ce que vous ferez En tant qu'ingénieur en fiabilité des sites, vous surveillerez de manière proactive le comportement du service et identifierez les opportunités d’améliorations, participerez au développement d'outils de surveillance et de dépannage des services Cloud basés sur les dernières technologies open source et SAP. Responsabilités Agir en tant qu'expert technique lors d’incidents de nos services en production, investiguer et résoudre les incidents à un niveau technique approfondi. Mener des analyses des causes sources (RCA) et faire le suivi sur les possibilités d’améliorations afin de prévenir que les problèmes se reproduisent. Effectuer des investigations approfondies et des analyses de journaux d’événements pour identifier et résoudre des problèmes complexes conformément aux promesses de niveau de service (SLA). Concevoir des solutions logicielles pour améliorer la fiabilité et la stabilité des services. Améliorer la surveillance de l'infrastructure et de la plateforme en amassant des métriques système (4 signaux en or) et implanter des outils pour aider à la récupération des services. Intégrer et collaborer étroitement avec les équipes de développement et travailler avec elles pour implémenter les améliorations identifiées lors des post-mortem. Rester à l’affut des nouvelles technologies et se tenir à jour techniquement. Créer et maintenir une documentation technique. Définir, promouvoir et appliquer les meilleures pratiques de l'ingénierie de fiabilité des sites. Être sur appel (rotation) afin de réagir aux alertes et prévenir les incidents majeurs. Le temps sur appel bénéficie d'un régime de compensation spécial. Compétences et aptitudes requises Baccalauréat en informatique ou dans un domaine technique connexe. Expérience avec Kubernetes et bonne compréhension des technologies de conteneurisation. Compréhension des architectures cloud modernes (une expérience avec des plateformes cloud telles que AWS, Azure, GCP est un plus). Compétences en Scripting, CI/CD (ArgoCD, Concourse, Github Actions sont un plus) - enthousiasme pour l'automatisation. Travailler efficacement dans des situations d'urgence. Affinité pour analyser et résoudre rapidement les problèmes au sein d'une équipe mondiale. Excellente esprit d'équipe, passionné par son travail, motivé et dynamique. Excellentes compétences en communication – précis et basées sur des faits. Maîtrise l'anglais, français de base. Compétences et aptitudes supplémentaires (avantages) Expérience de programmation avec Go, Python, Bash. Certifications CKA/CKAD/CKS. Expérience avec les systèmes d'exploitation Unix/Linux. Expérience avec les outils modernes de surveillance, de journalisation et d'alerte (Grafana, Prometheus, Kibana, Loki, Splunk On-Call, Dynatrace). Meilleures pratiques de sécurité pour le développement et l’opération d'applications cloud. Participation à des projets open‑source. Fourchette de salaire : 97 800 - 166 200 CAD par an (heure). Le montant effectif proposé dépendra de la formation, des compétences, du périmètre du poste, du lieu de travail, etc. SAP s'engage à respecter les principes d'égalité des chances en matière d'emploi et à adapter raisonnablement ses installations à destination des candidats présentant un handicap physique et/ou mental. #J-18808-Ljbffr
Devops Engineer - Équipe De Site Reliability Engineering De Btp
SAP
montreal (administrative region), montreal (administrative region)
Published 27 days ago
Report job