Description du poste
*Développement d’un système de défense autonome : prédiction d’attaques DDoS et recommandation automatique de contre-mesures (RL & IA décisionnelle) *
*Contexte*
Les travaux précédents ont permis de développer des modèles de *prédiction d’attaques DDoS* atteignant plus de *99 % de précision avec XGBoost* sur des jeux de données de référence (CICDDoS2019 / CICIDS2017).
La prochaine étape naturelle consiste à *passer de la prédiction à l’action*, en construisant un *système de défense autonome* capable :
* D’anticiper une attaque,
* De *choisir automatiquement* la meilleure contre-mesure,
* D’en *évaluer l’impact* sur les performances du réseau.
L’objectif du stage est donc de concevoir un *module intelligent de mitigation automatique*, combinant *IA décisionnelle (Reinforcement Learning, bandits)* et *connaissances expertes SOC*.
*Objectifs du stage*
Concevoir et implémenter un système de défense autonome qui, à partir des prédictions d’attaque (modèles déjà existants), recommande et simule automatiquement les contre-mesures DDoS les plus adaptées à la situation.
*Tâches à réaliser :*
* *Modéliser le problème de défense comme un processus de décision séquentiel* :
- Etat = contexte réseau (trafic, type d’attaque, intensité, historique),
- Actions = contre-mesures (rate limiting, filtrage d’ip / ports, blackhole, rerouting, throttling applicatif),
- Récompense = combinaison _sécurité + qos_ (réduction trafic malveillant, latence, disponibilité).
* *Concevoir un moteur de décision intelligent basé sur :*
*- Reinforcement Learning (RL)* : Q-Learning / DQN / PPO,
- ou *bandits contextuels* pour des décisions plus rapides,
- et/ou *systèmes experts hybrides* (règles SOC + modèle IA).
* *Développer un simulateur de réseau / environnement de test :*
- Reproduction de scénarios ddos (cicddos2019, CICIDS2017),
- Simulation de l’impact des actions (perte de trafic légitime, latence, taux d’attaque bloqué).
* *Évaluer la performance du système de défense :*
- Taux de mitigation (trafic malveillant bloqué),
- Impact sur les clients légitimes (false positives, qos),
- Temps de réaction et stabilité des décisions.
* *Intégrer le module dans une architecture quasi temps réel :* connexion au modèle de prédiction existant (API), moteur de décision autonome, journalisation / audit des décisions (traçabilité SOC).
*Livrables attendus*
* *Modèle MTL opérationnel* (détection + forecasting).
* *Pipeline temps réel* complet (data → modèle → prédiction).
* *API REST* réalisant l’inférence en moins de 50 ms.
* *Dashboard SOC* affichant : Probabilité d’attaque, Prévision d’intensité, Alertes en streaming.
* *Rapport scientifique* + documentation technique.
* Recommandations pour mise en production (scalabilité, monitoring).
*Profil recherché*
* Étudiant en *Master 2*
* Compétences souhaitées : Python, deep learning, séries temporelles, Notions en sécurité réseau & DDoS
* Bases en modélisation statistique / machine learning
* Notions ou forte motivation pour apprendre le *Reinforcement Learning*.
* Curiosité scientifique, autonomie, goût pour l’innovation.
Type d'emploi : Stage
Durée du contrat : 6 mois
Rémunération : 4,35€ par heure
Nombre d'heures : 35 par semaine
Lieu du poste : En présentiel