Description du poste
Type de contrat : Stage
Niveau de diplôme exigé : Bac + 4 ou équivalent
Fonction : Stagiaire de la recherche
Contexte et atouts du poste
Le projet Corpus Liberatum Linguae Graecae (CLLG) a pour objectif d’enrichir et d’étendre les corpus ouverts existants en grec ancien — de l’époque archaïque à la période byzantine — en rendant librement disponibles de nouveaux textes encore absents des corpus actuels.
Cet élargissement s’appuie sur l’acquisition par OCR et leur encodage normalisé en XML-TEI.
Dans ce contexte, nous ouvrons un stage de 3 mois en temps plein (ou 6 mois à temps partiel avec jours fixes), rémunéré (SMIC: 1801,80€ bruts par mois plein), en présentiel à Inria Paris (75013).
La personne recrutée sera accompagnée dans la modélisation numérique de corpus grecs, si possible en lien avec son projet de recherche.
Le ou la stagiaire, de niveau M2 (de préférence) ou M1, aura pour mission d'encoder, corriger et valoriser un corpus d'un auteur ou d'une thématique choisi(e) en concertation avec l'équipe de CLLG, et si possible au centre d'un projet de recherche de type thèse ou mémoire de M2.
Le ou la stagiaire participera à la vie de l'équipe ALMAnaCH, équipe de traitement automatique des langues et d'humanités computationnelles au sein d'Inria Paris.
La personne recrutée sera amenée à intéragir fortement avec l'équipe du projet CLLG à Inria, composée d'un ingénieur machine learning, d'une data librarian et de deux chercheurs, Thibault Clérice et Benoit Sagot.
Le corpus ainsi produit dans le cadre du projet sera publié librement, ainsi que toute autre production faite dans le cadre du stage.
Durée du stage: 3 mois temps plein ou 6 mois mi-temps
Compétences nécessaires: Connaissance du grec ancien (Parcours lettres classiques ou histoire avec une option en grec ancien)
Compétences souhaitées: Capacité d'encodage XML TEI
Intérêt pour le numérique Profil souhaité: Étudiant-e en M1 ou M2 (avec volonté de poursuivre en thèse) ou doctorant-e.
Compétences relationnelles: capacité de travailler en équipe, enthousiaste
Mission confiée
Missions :
Sous la responsabilité de Thibault Clérice, responsable du projet, et de Antonia Karamolengkou, ingénieure data du projet CLLG, la personne recrutée aura pour objectif de veiller à la production d'un corpus XML TEI en Grec ancien sur une thématique ou un auteur en lien avec ses activités de recherche.
Pour une meilleure connaissance du sujet de recherche proposé :
Hugh Cayless, Thibault Clérice, Jonathan Robie.
Introducing Citation Structures.
Balisage: The Markup Conference 2021, Aug 2021, Washington, United States.
10.4242/BalisageVol26.Cayless01 .
hal-04262751
Thibault Clérice.
CapiTainS Toolkit, Digital Editing and Data Reuse.
Médiévales, 2017, 73 (73), pp.115
- 131.
10.4000/medievales.8211 .
hal-02892280
Thibault Clérice.
Du Thesaurus Linguae Graecae (TLG) au Corpus Liberatum Linguae Graecae (CLLG).
2025.
https://www.canal-u.tv/chaines/universite-lyon-3-davm/du-thesaurus-linguae-graecae-tlg-au-corpus-liberatum-linguae-graecae
Collaboration :
La personne recrutée sera en lien avec Benoit Sagot, responsable de l'équipe ALMAnaCH et participant au projet CLLG, et Nicolas Angleraud, ingénieur IA du projet, ainsi qu'avec le reste de l'équipe humanités numériques ou corpus au sein d'ALMAnaCH
Principales activités
Principales activés:
Identification d'un corpus non présent dans les corpus ouverts (Perseus, Scaife, Patristic Text Archive);
Production d'un corpus XML TEI, et de données de références pour la reconnaissance de texte imprimé (OCR) via les outils du projet.
Intégration de cette approche dans un projet de recherche.
Activités complémentaires:
Création de ressources linguistiques pour les textes identifiés;
Aide à l'identification de ressources nécessaires supplémentaires;
Participer à la vie du projet.
Compétences
Compétences techniques et niveau requis :
Une compétence en XML TEI est possible, mais n'est pas nécessaire;
Aisance avec l'outil informatique;
Langues :
Grec Ancien
Francais ou Anglais
Compétences relationnelles:
Être capable de se former, d'avoir la curiosité et l'aisance pour demander du soutien quand cela est nécessaire, identifier ses besoins de formation supplémentaire.
Être capable de communiquer avec ses responsables de stage pour communiquer sur ses difficultés le cas échéant.
Avantages
Restauration subventionnée
Transports publics remboursés partiellement
Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
Possibilité de télétravail et aménagement du temps de travail
Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
Accès à la formation professionnelle
Sécurité sociale
Informations générales
Thème/Domaine : Langue, parole et audio
Production, traitement et analyse des données (BAP D)
Ville : Paris
Centre Inria : Centre Inria de Paris
Date de prise de fonction souhaitée : 2026-04-01
Durée de contrat : 3 mois
Date limite pour postuler : 2025-11-30
Attention: Les candidatures doivent être déposées en ligne sur le site Inria.
Le traitement des candidatures adressées par d'autres canaux n'est pas garanti.
Consignes pour postuler
Sécurité défense :
Ce poste est susceptible d’être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST).
L’autorisation d’accès à une zone est délivrée par le chef d’établissement, après avis ministériel favorable, tel que défini dans l’arrêté du 03 juillet 2012, relatif à la PPST.
Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l’annulation du recrutement.
Politique de recrutement :
Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap.
Contacts
Équipe Inria : ALMANACH
Recruteur :
Clerice Thibault / thibault.clerice@inria.fr
L'essentiel pour réussir
Goût pour le grec ancien et la recherche scientifique en lettres classiques;
Fort intérêt pour le numérique, et des situations de collaborations interdisciplinaires;
Se sentir à l'aise dans un environnement de dynamique scientifique, aimer apprendre et écouter sont des qualités essentielles pour réussir cette mission
A propos d'Inria
Inria est l’institut national de recherche dédié aux sciences et technologies du numérique.
Il emploie 2600 personnes.
Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l’interface d’autres disciplines.
L’institut fait appel à de nombreux talents dans plus d’une quarantaine de métiers différents.
900 personnels d’appui à la recherche et à l’innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde.
Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up.
L'institut s'efforce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.
Avantages:
• Prise en charge du transport quotidien
• RTT
• Programme de formation