Description du poste
Cette offre est disponible dans les langues suivantes :
- Français- Anglais
Date Limite Candidature : samedi 14 février 2026 23:59:00 heure de Paris
Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler
Informations générales
Intitulé de l'offre : Stage H/F
- Évaluation automatisée de la qualité des IRM dans les entrepôts de données de santé
Référence : UMR7225-NINBUR-008
Lieu de travail : PARIS 13
Pays : France
Date de publication : samedi 24 janvier 2026
Type de contrat : Convention de stage
Durée du contrat : 6 mois
Date d'embauche prévue : 1 avril 2026
Quotité de travail : Complet
Niveau de diplôme préparé : BAC+5
BAP : A
- Sciences du vivant, de la terre et de l'environnement
Description du poste
Le sujet
Ces dernières années, de très grands entrepôts de données de santé (EDS) ont été créés, contenant les données médicales de millions de patients.
L'EDS de l'AP-HP (Assistance Publique-Hôpitaux de Paris) rassemble les données d'imagerie médicale de nombreux hôpitaux de la région parisienne.
Cette ressource offre une formidable opportunité de former et de tester des modèles d'apprentissage automatique efficaces sur de grandes cohortes cliniques pour diverses tâches de neuroimagerie, allant des contrôles de routine à l'étude de pathologies rares.
Contrairement aux ensembles de données de recherche, où les protocoles d'acquisition sont bien standardisés, la nature et la qualité des images des EDS sont très hétérogènes.
Tout d'abord, de nombreuses IRM sont inutilisables car elles sont corrompues par divers artefacts (bruit, mouvement, mauvais contraste des tissus...).
Ensuite, leurs métadonnées sont souvent inexactes, ce qui signifie que la récupération automatique des données sur la base de certains critères (séquence, résolution, pathologie) n'est pas fiable.
Il est donc essentiel de détecter ces effets directement à partir des images elles-mêmes.
Cependant, le contrôle visuel par des évaluateurs humains est impossible en raison du volume important d'images.
Il est donc nécessaire de disposer d'outils automatiques capables d'effectuer de manière fiable le contrôle qualité des images issues du soin courant et d'en extraire des informations.
L’équipe ARAMIS a développé un modèle d'apprentissage profond permettant de vérifier automatiquement la qualité des IRM pondérées en T1 et ainsi de sélectionner les données pouvant être utilisées pour entraîner des modèles d'apprentissage profond basés sur la génération d'artefacts synthétiques [1].
Récemment, nous avons proposé une généralisation de cet outil à une nouvelle séquence d'IRM, la FLAIR, basée sur des techniques d'adaptation de domaine [2].
Le projet
Ce projet consiste à développer un nouvel outil pour le contrôle qualité automatique et la recherche d'informations à partir d'images issues d'IRM.
Dans la continuité de nos travaux précédents [1], nous proposons ici de nous appuyer sur des stratégies de simulation afin de réduire le besoin de vérités terrain manuelles pour la présence/l'intensité des artefacts.
De plus, au lieu d'adapter notre réseau d'apprentissage profond de contrôle qualité à plusieurs types d'IRM (c'est-à-dire à plusieurs domaines), nous proposons ici d'adopter une approche de randomisation des domaines, dont SynthSeg [3] est le meilleur exemple.
Dans ce paradigme, des modèles génératifs paramétriques sont utilisés pour synthétiser des images d'aspect extrêmement variable, qui sont ensuite utilisées pour entraîner un système d'IA indépendant du domaine.
Une revue de la littérature sera nécessaire pour identifier (a) les techniques de randomisation de domaine de pointe [4] basées sur des outils d'apprentissage profond ; (b) les meilleurs moyens de générer des ensembles de données synthétiques contenant des artefacts variés.
Une fois identifiées, les techniques seront mises en œuvre et testées sur des données de recherche avant d'être appliquées aux images de l’EDS.
Enfin, des expériences seront menées afin de déterminer si cette méthode permet d'obtenir une meilleure estimation de la qualité globale de l'image que notre approche actuelle [2].
Dans l'ensemble, ce projet combine une composante importante de génération d'images avec des architectures d'apprentissage profond de pointe (modèles de diffusion, CNN, etc.).
En cas de succès, les développements méthodologiques seront intégrés au logiciel open source ClinicaDL (https://clinicadl.readthedocs.io), conçu pour permettre un traitement reproductible des images cérébrales grâce à l'apprentissage profond.
Description de l'employeur
Ce projet sera mené conjointement par l'équipe Epione à Antibes et l’équipe ARAMIS à Paris, deux équipes de recherche de renommée mondiale dans le domaine de l'analyse d'images médicales et des neurosciences.
Vous êtes libre de choisir votre lieu de travail principal, avec la possibilité de bénéficier d'une prise en charge des frais de déplacement entre les deux sites.
L'équipe Epione (environ 60 personnes) fait partie d'Inria (Institut national de recherche en sciences et technologies du numérique) et est située dans le pôle technologique de Sophia-Antipolis.
Son expertise porte sur l'analyse d'images médicales et se situe à la croisée de l'apprentissage automatique, de la modélisation physique et des statistiques géométriques.
L’équipe ARAMIS est hébergée à l’Institut du Cerveau, dans le centre de Paris.
ARAMIS (environ 40 personnes) est une équipe conjointe de Sorbonne Université, du CNRS, d'Inria, de l’Inserm, et de l’AP-HP qui se consacre au développement de nouvelles approches computationnelles pour l'analyse de grands ensembles de données cliniques et de neuroimagerie.
Dans les deux cas, les équipes ont une forte composition multidisciplinaire, réunissant des chercheurs en apprentissage automatique et des médecins.
Ce projet vous donnera l'occasion d'interagir avec les doctorants et les ingénieurs du laboratoire, ainsi qu'avec nos collaborateurs médicaux de l'hôpital de la Pitié-Salpêtrière.
Descriptif du profil recherché
- Master ou diplôme d'ingénieur en cours avec un profil en informatique, analyse d'images et/ou mathématiques appliquées.
- Fort intérêt pour les applications médicales.
- Connaissance du deep learning.
- Connaissance du traitement d'images et de l'imagerie médicale.
- Bonnes compétences en programmation Python.
- Bonnes compétences rédactionnelles.
- Bonnes aptitudes relationnelles et en communication pour interagir avec des professionnels issus de divers horizons.