Offre d'emploi Data Scientist Stagiaire – Génération de tests fonctionnels avec LLMs (F/H) - Adopt1Alternant

Description du poste

Description de l'entreprise Pourquoi feriez-vous le grand saut ? Dans le TOP10 des Sociétés de Conseil en Ingénierie en France, le Groupe SCALIAN intervient sur des activités de services en management de projets industriels, supply chain, architecture et développement de systèmes numériques embarqués, applicatifs de systèmes d'information et d'Intelligence artificielle dans des secteurs d’activité aussi variés que l’aéronautique, le spatial, l’automobile, le ferroviaire, les services, le luxe ou le retail etc. Créée en 1989, SCALIAN compte aujourd’hui plus de 5500 collaborateurs répartis dans 12 pays et 15 implantations en France pour un chiffre d’affaires de 550 millions d’euros.

SCALIAN travaille pour des grands Groupes du CAC40 sur des projets en AT ou au forfait. Labellisée Great Place to Work, SCALIAN connait une croissance de 20% chaque année. Pourquoi SCALIAN ? Parce que Scalian vous accompagne dans le développement de votre carrière : programme d'onboarding complet sur 1 an avec votre manager et votre RH, programmes de formation personnalisés, communautés techniques, événements internes Parce que Scalian favorise la Qualité de Vie au Travail : certifications Great Place to Work® et Best Workplaces for Women, prime de cooptation, prime vacances, accord télétravail Parce que Scalian développe une politique RSE concrète et ambitieuse : mobilité durable, actions environnementales, actions handicap (accord agréé, processus de recrutement inclusif, formation des managers et des recruteurs, mission handicap avec temps dédié : missionhandicap@scalian.com) Why take the plunge? One of France's TOP10 engineering consultancies, the Group provides services in industrial project management, supply chain, architecture and development of embedded digital systems, information systems applications and Artificial Intelligence in sectors as varied as aeronautics, space, automotive, rail, services, luxury goods and retail. Founded in 1989, SCALIAN today employs over 5,500 people in 12 countries and 15 locations in France, with sales of 550 million euros.

SCALIAN works for major CAC40 groups on both TA and fixed-price projects. Awarded the Great Place to Work label, SCALIAN is growing by 20% every year. Why SCALIAN? Because Scalian supports you in your career development: comprehensive 1-year onboarding program with your manager and HR, personalized training programs, technical communities, internal events, etc. Because Scalian promotes Quality of Life at work: Great Place to Work® and Best Workplaces for Women certifications, co-optation bonus, vacation bonus, teleworking agreement. Because Scalian is developing a concrete and ambitious CSR policy: Sustainable mobility, Environmental actions, Handicap Agreement and Mission Handicap with dedicated time (missionhandicap@scalian.com).

Inclusive recruitment process, training for managers and recruiters. Description du poste Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois ? Nous disposons au sein de chez Scalian d’un Lab Innovation nommé Insights.

Il est le catalyseur des projets de R&D du groupe et est réparti sur l’ensemble de la France. Contexte : Les recherches sur l’utilisation des Grands Modèles de Langage (ou Large Language Models, LLMs) ont montré des résultats prometteurs dans la génération de code source ainsi que dans la création de cas de tests unitaires.

Dans le domaine du software testing, l’un des défis encore non résolus consiste à exploiter les LLMs pour les activités précoces du cycle de vie des tests, telles que les tests fonctionnels.

Malgré leurs succès initiaux, il n’est pas encore clairement établi quelle est l’efficacité réelle de ces modèles pour générer des tests fonctionnels conformes aux exigences. SCALIAN Insights a mené plusieurs travaux visant à répondre à cette question, notamment en étudiant des facteurs tels que la stratégie de prompting (ou prompt engineering) et l’évaluation des tests générés sur des jeux de référence (benchmarks).

La poursuite de ces travaux vise à explorer de nouvelles approches pour intégrer davantage de contexte
- par exemple à partir de l’expression des besoins ou des spécifications fonctionnelles
- en s’appuyant sur des techniques comme GraphRAG (Retrieval-Augmented Generation avec graphe de connaissances) ou encore sur la collaboration entre agents dotés de rôles spécifiques basés sur des LLMs (Mixture of Agents, MoA) et Model Contex Protocol (MCP). [1] Junjie Wang et al., « Software Testing with Large Language Models: Survey, Landscape, and Vision » (arXiv, 4 mars 2024), http://arxiv.org/abs/2307.07221. [2] Junlin Wang et al., « Mixture-of-Agents Enhances Large Language Model Capabilities » (arXiv, 7 juin 2024), http://arxiv.org/abs/2406.04692. [3] https://modelcontextprotocol.io/docs/getting-started/intro Vos missions s'articuleront autour des axes suivants : Contribution au développement d’un pipeline pour générer des tests fonctionnels pour le framework Cypress avec des modèles LLMs Développement d’un système de RAG pour enrichir les stratégies de prompt avec des documents fonctionnels (expression de besoins, spécifications fonctionnelles) Développement d’un système d’agents basés sur des LLMs inspirés de l’architecture MoA appliqué à la génération de tests fonctionnels Cypress Qualifications Elève ingénieur ou universitaire en dernière année de cursus BAC+5 en data science : Connaissances en utilisation des modèles LLMs Connaissances techniques : Python : Hugging Face Transformers, LangChain, AutoGen, MCP Vous êtes curieux, méthodique, rigoureux et autonome Informations supplémentaires Quelles seront les prochaines étapes ? 1er entretien avec le N+1 2nd entretien avec la N+2 #LI-CM4 Avantages:
• Programme de recommandation