Description du poste
Cette offre vous intéresse ?
Nous rejoindre
Vous avez envie de faire carrière au sein d'un organisme public qui a pour mission de protéger efficacement la santé des populations ? Rejoignez-nous.
Postuler
Présentation de l'agenceAfficherMasquer
Santé publique France est l’agence nationale de santé publique française.
Etablissement public de l’Etat sous tutelle du ministre chargé de la santé créé par l’ordonnance 2016-246 du 15 avril 2016, elle intervient au service de la santé des populations.
Agence scientifique et d’expertise du champ sanitaire, elle a pour missions :
L'observation épidémiologique et la surveillance de l'état de santé des populations ;
La veille sur les risques sanitaires menaçant les populations ;
La promotion de la santé et la réduction des risques pour la santé ;
Le développement de la prévention et de l'éducation pour la santé ;
La préparation et la réponse aux menaces, alertes et crises sanitaires ;
Le lancement de l'alerte sanitaire.
L’agence est organisée autour de directions scientifiques et transversales et de directions assurant le support et le soutien à l’activité.
Son programme de travail, arrêté par son Conseil d’administration, s’articule autour de cinq axes prioritaires : les déterminants de santé, les populations, les pathologies, les interventions et les territoires, et les infrastructures.
AffectationAfficherMasquer
Direction Appui, Traitements et Analyses des données
Description du posteAfficherMasquer
Missions
La personne recrutée aura pour mission de traiter et analyser des données issues des systèmes de surveillance épidémiologique de Santé publique France, en couvrant l’ensemble des étapes : gestion et structuration des bases de données, développement et optimisation de scripts, construction d’indicateurs épidémiologiques à l’aide de méthodes statistiques ou de data science, ainsi que la restitution de ces indicateurs sous forme de bulletins ou de tableaux de bord.
Les données traitées pourront provenir de systèmes de surveillance spécifiques ou non spécifiques et concerner des thématiques variées, qu’il s’agisse de populations générales ou spécifiques, de pathologies ou de déterminants de santé.
Une attention particulière sera portée sur le développement et le maintien d’outils et de processus permettant de produire, en temps réel et de manière réactive, des indicateurs essentiels en situation d’alerte ou de crise sanitaire.
Le titulaire du poste contribuera également à l’innovation méthodologique en participant à la conception et à l’implémentation de méthodes et d’outils avancés pour le traitement des données de santé.
Ce rôle implique une collaboration étroite avec des équipes pluridisciplinaires (épidémiologistes, biostatisticiens, etc.) et une contribution active à la veille technologique et scientifique, afin de renforcer la capacité de l’agence à répondre aux enjeux actuels et émergents en santé publique.
La restitution des résultats, sous forme de rapports, de visualisations ou de présentations, sera un aspect clé du poste, tout comme la formation et l’accompagnement des équipes à l’utilisation des outils développés.
Activités
Sous l’autorité du responsable d’unité et en lien étroit avec la personne en charge du pilotage
de l’activité Data Science & Data Ingénierie de la direction, le data engineer/scientist aura
pour mission d’assurer la gestion, le traitement et la restitution des données.
Ses activités consisteront notamment à :
Concevoir, développer et maintenir des systèmes de gestion de données et des pipelines automatisés couvrant l’ensemble du cycle de traitement et de restitution des données.
Nettoyer, structurer et préparer des données, en garantissant leur qualité, leur fiabilité, leur traçabilité et leur conformité aux exigences réglementaires.
Explorer et proposer des solutions technologiques pour faire progresser la qualité et la fiabilité des données.
Identifier les possibilités d'acquisition et d’intégration de nouvelles sources de données pour enrichir les connaissances au service de la santé des populations.
Définir, implémenter et interpréter des indicateurs de surveillance adaptés aux enjeux métiers.
Concevoir, développer et optimiser des méthodes statistiques et d’apprentissage automatique et profond pour la construction d’indicateurs épidémiologiques, la détection de signaux et la modélisation prédictive.
Développer des outils de monitoring et de restitution (API, tableaux de bord interactifs, rapports automatisés) pour répondre aux besoins opérationnels et stratégiques de l’agence.
Identifier et intégrer de nouvelles sources de données, ainsi que des approches technologiques émergentes (IA, traitement distribué, etc.) pour enrichir les analyses et renforcer la réactivité en situation de crise.
Travailler en étroite interaction avec des épidémiologistes, biostatisticiens et ingénieurs pour traduire les besoins métiers en solutions techniques robustes.
Rédiger des notes méthodologiques, contribuer à la valorisation des résultats (bulletins, rapports d’études et articles scientifiques) et former les équipes à l’utilisation des outils développés.
Ce poste s’inscrit dans un environnement technique évolutif et collaboratif, mobilisant des outils de développement modernes et des langages adaptés à la science des données.
À terme, il bénéficiera d’une infrastructure de calcul performante, actuellement en cours de déploiement.
La personne recrutée évoluera au sein d’une équipe pluridisciplinaire, en interaction étroite avec des épidémiologistes, data scientistes, biostatisticiens, ingénieurs, ainsi que les membres de la Direction des Systèmes d’Information (DSI) et le RSSI (Référent sécurité des systèmes d’information).
Les principaux outils et technologies mobilisés incluent :
Langages de programmation : Python / R / SAS ;
Rapports automatisés : Rmarkdown / Quarto ;
Environnement collaboratif : GitLab (versioning, intégration continue, gestion des issues) ;
Automatisation et orchestration : Apache Airflow (déploiement, supervision des workflows), Docker ;
Formats et bases de données : PostgreSQL, fichiers Parquet, CSV ...
Environnements de développement : VS Code, R Studio, IA Mistral ;
Traitement intensif : Apache Spark via serveurs sécurisés de calcul haute performance (en cours de construction).
La personne recrutée pourra être amenée à représenter Santé publique France dans des instances nationales et internationales, lors d’échanges scientifiques ou institutionnels.
Elle encadrera également des stagiaires de niveau Master 2, des internes de santé publique et des doctorants sur des thématiques liées à l’ingénierie et à la science des données.
Enfin, elle participera à la continuité d’activité par le biais de permanences hebdomadaires et d’astreintes de week-end, et pourra être sollicitée pour contribuer à toute activité relevant des missions de l’Agence, notamment en situation d’urgence ou de crise.