OVHcloudPublished about 2 hours
Logo OVHcloud

Site Reliability Engineer VMware - F/H/N

Site Reliability Engineer VMware - F/H/N

Au sein de votre équipe #OneTeam

Vous rejoindrez l'équipe SRE en charge des solutions VMware au sein d'OVHcloud. Vous intégrerez plus précisément la squad qui répond aux activités journalières d'incidentologie sur les produits VMware (Managed VMware vSphere, Public VCFaaS, Private VCFaaS) et backup (Veeam) existants et à venir.

Au sein d'OVHcloud, nous adoptons une approche de développement augmentée par l'IA, où l'IA générative est intégrée aux pratiques quotidiennes : conception, développement, tests, revue de code et documentation.

Vos principales responsabilités

  • Gérer les incidents complexes du périmètre et assurer un support client de niveau 3.
  • Analyser les causes racines des incidents pour proposer des résolutions durables.
  • Développer des correctifs de code (Go/Perl) pour réduire la récurrence des incidents et améliorer les produits existants.
  • Participer activement à la rotation d'astreinte pour garantir une qualité de service 24/7/365.
  • Contribuer aux projets de migration et de mise à jour des infrastructures.
  • Appliquer des pratiques de Prompt Engineering pour automatiser et optimiser les tâches opérationnelles.
  • Collaborer au sein d'une équipe Agile pour fluidifier les processus d'intégration et de déploiement (CI/CD).
  • Proposer des améliorations continues basées sur les méthodologies SRE.

Votre futur impact

Dans 6 mois
Vous aurez pris en main le périmètre technique et les rituels d'équipe, et vous serez opérationnel sur la gestion des incidents de niveau 3. Vous aurez commencé à contribuer au développement de correctifs sur nos produits VMware et Veeam, tout en intégrant des solutions basées sur le Prompt Engineering pour assister vos missions quotidiennes.

Et dans 1 an
Vous serez autonome sur la résolution de problématiques complexes et aurez joué un rôle moteur dans l'optimisation des services managés. Vous aurez une compréhension fine de l'écosystème VCF, capable d'anticiper les besoins d'évolution et de proposer des solutions techniques robustes pour améliorer durablement la stabilité de nos plateformes. Contribué à la montée en maturité des pratiques de développement augmenté par l'IA (prompt engineering et intégration d'agents IA) au sein de l'équipe, notamment par la mise en place de chaînes agentiques opérationnelles.

Compétences requises

  • Vous maîtrisez les méthodologies SRE et les outils CI/CD.
  • Vous possédez une compréhension solide des langages Go et Perl.
  • Vous êtes à l'aise dans un environnement rythmé par l'incidentologie.
  • Vous savez travailler efficacement en équipe et selon les méthodes Agiles.
  • Vous maitrisez le prompt engineering et avez une compréhension des principes des chaînes agentiques / des workflows autonomes (orchestration d'agents, gestion d'outils/fonctions, boucles de rétroaction).
  • Vous avez un bon niveau d'anglais, écrit comme oral.

C'est un +

  • Vous avez une expérience significative sur les produits VMware (suite VCF) ou des technologies de virtualisation équivalentes.
  • Vous connaissez les technologies de backup Veeam.
  • Contributions à des projets open source liés à l'IA générative ou aux agents.

Cette offre ne répond pas tout à fait à vos attentes ? Candidatez malgré tout ! C'est l'occasion de partager votre profil avec nos recruteurs, vous faire remarquer et peut-être recontacter pour une autre opportunité.

Cette offre ne répond pas tout à fait à vos attentes ? Candidatez spontanément sur le portail candidat pour rejoindre l'une de nos équipes ! L'occasion de partager votre profil avec nos recruteurs, vous faire remarquer et peut-être recontacter pour une autre opportunité.

Reference :cap-digital-job-board-welcomekit-co-+OVHcloud-Site-Reliability-Engineer-VMware-FHN

Skills

Cloud
VMWare
VMware vSphere
Backend
Go
Perl
Tooling
VEEAM