Description du poste
L'entreprise
Butagaz est un fournisseur multi-énergies, acteur majeur du Gaz Liquide, présent depuis 90 ans sur le territoire français.
Fondé en 1931 par un duo d’entrepreneurs, la marque n’a cessé de grandir pour devenir désormais un Groupe qui propose la plus large gamme d’énergies aux professionnels comme aux particuliers : du gaz en bouteille et en citerne qui sont ses activités historiques mais aussi du gaz naturel, de l’électricité, des granulés de bois et du photovoltaïque.
Nos 4 valeurs : proximité, chaleur humaine, éthique et responsabilité.
Butagaz s'engage pour l'humain et déploie une politique handicap visant à garantir une meilleure inclusion au sein de ses équipes.
Les candidatures de personnes en situation de handicap sont donc les bienvenues et seront étudiées avec attention par notre équipe recrutement.
Description du poste
Contexte :
Notre équipe Data/IA accompagne la mise en place et l’évolution d’une Data Platform pour centraliser, gouverner et valoriser les données de l’entreprise.
Nous souhaitons renforcer nos pratiques de gouvernance, améliorer la qualité des données, et explorer des solutions innovantes basées sur l’IA, notamment les LLM (Large Language Models).
Missions principales :
Gouvernance de la Data Platform : Participer à la définition et mise en œuvre des règles de gouvernance (catalogage, qualité, sécurité).
Contribuer à la mise à jour des référentiels et des métadonnées.
Assurer la cohérence des processus de gestion des données.
Documentation & Process : Rédiger et structurer la documentation technique et fonctionnelle liée à la Data Platform.
Créer des guides utilisateurs pour les équipes internes.
Mettre en place un système de versioning pour la documentation.
Développement d’un outil de Data Cleaning avec LLM : Étudier les besoins métiers en matière de nettoyage et normalisation des données.
Concevoir et implémenter un prototype d’outil utilisant des modèles de langage (LLM) pour automatiser le nettoyage (détection d’anomalies, correction, enrichissement).
Évaluer la performance et proposer des améliorations.
Livrables attendus :
Documentation complète des processus et outils.
Prototype fonctionnel d’un outil de data cleaning basé sur LLM.
Rapport d’évaluation et recommandation.
Profil :
Étudiant(e) en dernière année d’école d’ingénieur ou Master (Data Science, IA, Big Data).
Intérêt pour la gouvernance des données et les technologies IA.
Compétences recherchées :
Techniques : Python, SQL, Connaissance des concepts de Data Governance, Familiarité avec les LLM (OpenAI, HuggingFace, etc.), Outils de versioning (Git).
Soft skills : Rigueur et sens de l’organisation, Capacité à documenter et vulgariser, Curiosité et force de proposition.