Stéphane JEAN
  • Professeur des Universités
  • Ingénierie des Données et des moDèles

Activité d'Enseignement

Depuis 2004, j’enseigne à l’Université de Poitiers, au sein du département Informatique de l’UFR Sciences Fondamentales et Appliquées. Mon activité représente en moyenne 270 heures équivalent TD par an, majoritairement en Licence 3 et en Master, en Informatique et en Bio-Informatique.

Mes enseignements portent principalement sur les bases de données au sens large : modélisation conceptuelle, langage SQL, entrepôts de données, Big Data, web sémantique et ontologies ; autant de thématiques en lien direct avec mes activités de recherche. J’ai conçu et encadré de nombreuses unités d’enseignement, avec des supports complets (cours, TD, TP, projets) basés sur des jeux de données réalistes, souvent issus de projets collaboratifs avec des partenaires socio-économiques. J’ai également assuré la gestion pédagogique des serveurs Oracle utilisés par plusieurs enseignants. Par ailleurs, j’ai enseigné dans d’autres domaines : programmation (Ada, C, Java), technologies Web (XML, Jakarta EE, .NET), etc.

J’interviens également dans d’autres formations de l’Université de Poitiers (IUT, Magistère de Droit) ainsi qu’à l’ISAE-ENSMA. J’ai aussi eu l’opportunité d’être invité pour des enseignements sur les bases de données et le Web sémantique dans plusieurs universités à l’international : au Portugal (Coimbra), en Chine (Tianjin), au Vietnam (Hanoï) et au Venezuela (Caracas), dans le cadre de masters internationaux ou de programmes de coopération académique.

En parallèle de mes activités d’enseignement, j’ai assumé plusieurs responsabilités pédagogiques. De 2009 à 2013, j’ai été responsable de la communication de l’UFR SFA, impliquant des actions de promotion des formations scientifiques. Entre 2013 et 2018, j’ai pris en charge la gestion de la L3 Informatique, coordonnant l’équipe pédagogique, gérant les emplois du temps et les stages, et établissant des liens avec le milieu professionnel. De 2018 à 2020, j’ai élargi mes responsabilités à la Licence Informatique, pilotant l’offre de formation, coordonnant les recrutements et participant à l’évaluation HCERES. Enfin, depuis 2021, je suis directeur-adjoint du département Informatique. Dans ce cadre, je suis en appui de la directrice Sylvie Alayrangues dans la gestion de tous les dossiers relatifs au département. Cela inclut, entre autres,  la gestion courante du département (budget, recrutement permanent, ATER et vacataires, services d'enseignement) ainsi que des projets de développement des formations informatiques (plan d'investissement, nouvelle habilitation 2022-2028, etc.).

Activité de Recherche

Thématiques de recherche initiales : Base de données et Ontologies

Mes recherches visent à améliorer la gestion des données et en particulier, celles que l'on rencontre dans les domaines techniques liés aux thématiques de l'ENSMA (aéronautique, transport, mécanique et énergie).

La démarche suivie consiste à utiliser des modèles de connaissance appelés ontologies (ou dictionnaires dans les domaines techniques) qui fournissent une description consensuelle et formelle des concepts d'un domaine d'étude. Ces travaux s'appuient sur des ontologies normalisées et définies avec le modèle PLIB (norme ISO 13584) qui est spécialisé dans la description des données techniques. Cependant, les ontologies étant également fortement utilisées dans le contexte du Web Sémantique, mes travaux s'intéressent également aux modèles et langages développés dans ce contexte (RDF, RDF-Schema, OWL, SPARQL). 

Au centre de mes recherches se trouve des bases de données spécialisées pour la persistance d'ontologies, nommées Bases de Données Sémantiques (BDS) ou triplestores dans le contexte du Web Sémantique. J'ai développé trois axes de recherche autour de ces BDS.

L'extension et la généralisation des BDS

Cet axe a consisté dans un premier temps à étendre la BDS OntoDB/OntoQL, développée en partie pendant ma thèse, pour différentes problématiques telles que la prise en compte des préférences utilisateur ou l'annotation sémantique de modèles métiers utilisés en ingénierie. Dans un second temps, nous avons proposé une généralisation de cette plateforme pour qu'elle puisse être utilisée pour manipuler des modèles plus généraux que les ontologies. 

Ces travaux ont été menés lors de la thèse de Youness Bazhar (co-encadrement avec Yamine Aït-Ameur) et de celles de  Laura Silveira Mastella, Dilek Tapucu, Nabil Belaïd et Kevin Royer pour lesquelles je n'étais pas encadrant officiel mais dans lesquelles je me suis fortement impliqué. Ces travaux ont permis le développement des logiciels OntoDB/OntoQL et BeMoRe. Ils ont été valorisés lors de projets académiques (ANR EWok-Hub, DAFOE4APP, projet PRES PatriMAR) et applications industrielles (avec l'Institut Français du Pétrole IFP, le Bureau de Recherches Géologiques et Minières BRGM, l'Électricité de France EDF, la Compagnie Française de Câblage CFCA, la société Geosiris et le CRITT Informatique). 

L'ingénierie des BDS

Dans cet axe, nous nous sommes intéressés à la conception des BDS. Nous avons constaté que les particularités des ontologies nécessitaient de revoir le processus de conception classique mis en œuvre dans les BD usuelles. Nous avons ainsi proposé d'ajouter une phase d'intégration des besoins à ce processus. Par ailleurs, constatant que les BDS présentaient une diversité en termes d'architectures et de modèles de stockage utilisés pour la persistance des données, nous avons proposé une démarche générale de conception d'une BDS qui prend en compte cette diversité. Cette démarche nous a aussi amenés à revisiter le problème de sélection des vues matérialisées pour prendre en compte la diversité des BDS. 

Ces travaux ont été réalisés dans le cadre des thèses soutenues par Ilyès Boukhari, Bery Mbaiossoum et Selma Bouarar  (co-encadrements avec Ladjel Bellatreche). Ces travaux ont impliqué le développement des logiciels OntoDBench et d'une extension de la plateforme OntoDB/OntoQL pour la gestion de besoins hétérogènes. Ces développements ont été valorisés dans le cadre de prestations avec les entreprises Bimedia et CFCA.

Le développement d'approches coopératives pour les BDS

Cet axe concerne l'exploitation des BDS via des requêtes et, plus particulièrement, il vise à proposer des techniques pour aider l'utilisateur lorsqu'une requête exprimée sur une BDS retourne un résultat insatisfaisant (par exemple, un résultat vide ou, à l'inverse, pléthorique). Pour répondre à cette problématique, l'originalité de nos travaux est d'essayer, avant tout, d'identifier les raisons pour lesquelles la requête utilisateur ne retourne pas un résultat satisfaisant. Nous avons également étendu ces travaux au contexte des ontologies incertaines.

Ces travaux ont été réalisés dans le cadre des thèses soutenues de Géraud Fokou (co-encadrement avec Allel Hadjali), Ibrahim Dellal (co-encadrement avec Allel Hadjali et Brice Chardin) et Louise Parkin (co-encadrement avec Allel Hadjali et Brice Chardin). Je me suis également fortement investi dans la thèse de Chourouk Belheouanne sans être encadrant officiel.  Ces travaux ont impliqué le développement de la plateforme Chemane qui a été utilisée dans le cadre du projet de recherche QDOSSI (projet CNRS) et d'une prestation avec l'entreprise ActivKonnect.

Axes de recherche récents

Récemment, j’ai également exploré de nouveaux axes de recherche :
  • Établissement d'un réseau anonyme de confiance pour les applications communautaires : cet axe a été développé dans le cadre de la thèse CIFRE de Chayma Sellami (2019-2022) avec l'entreprise Ocode. Ce travail s'intéresse aux modèles de confiance qui permettent d’évaluer la fiabilité d’un réseau d’utilisateurs anonymes. Nous avons proposé une démarche permettant, d’une part, de définir des exigences sur l’application communautaire en cours de conception, et d’autre part, d’identifier le modèle de confiance le plus adapté.
  • Modélisation d'objets 3D et annotations sémantiques : cet axe a été développé dans le cadre de la thèse de Maxime Gaide (2021-2024), en collaboration avec le laboratoire XLIM (co-encadrement avec Xavier Skapin et Agnès Arnould). Cette thèse a porté sur l’amélioration des modeleurs 3D pour rejouer des spécifications paramétriques définissant la construction des objets. Nous étudions actuellement le lien entre la modélisation de ces objets et les annotations sémantiques qui les caractérisent.
  • IA générative et extraction de connaissances : les grands modèles de langage (LLM) offrent de nouvelles perspectives pour la gestion des connaissances. Cet axe explore le lien entre les outils d’IA générative, qui ne possèdent pas intrinsèquement de capacités de raisonnement, et les ontologies, qui visent à structurer formellement la connaissance. Deux thèses en cours s’inscrivent dans cette thématique :
    • La thèse de Mathieu Chartier (depuis 2022), en collaboration avec le CRIHAM (co-encadrement avec Guillaume Bourgeois). Nous avons notamment évalué les capacités des LLM à répondre à des questions historiques. Nous avons ensuite exploré l’amélioration des réponses des LLM grâce à la technique du Retrieval Augmented Generation (RAG), combinée à des méthodes classiques de recherche d’information. Ces recherches ont abouti au développement de l'Atlas Historique de la Nouvelle-Aquitaine, un moteur de recherche basé sur l'IA qui donne accès à des milliers de documents historiques portant sur la région Nouvelle-Aquitaine.
    • La thèse d'Ali Hariri (depuis 2023), développée dans le cadre du projet ANR Digitalis (co-encadrement avec Mickaël Baron). Nous nous intéressons particulièrement à l’utilisation des LLM pour formaliser les connaissances des archéologues lors de l’étude de monuments tels que l’Hypogée des Dunes ou le Palais des Ducs de Poitiers.

Encadrement de thèses de doctorat en cours

  • Mathieu Chartier, Construction d'un Atlas historique de la Nouvelle-Aquitaine,  co-encadrement avec Guillaume Bourgeois. Thèse débutée en octobre 2022.
  • Ali Hariri, Partage et analyse de données multi-points de vues pour la préservation du patrimoine culturel : une approche guidée par les ontologies, co-encadrement avec Mickaël Baron. Thèse débutée en octobre 2023.

Encadrement de thèses de doctorat soutenues

  1. Maxime PerrotAnalyse explicable et personnalisable de données hétérogènes multi-niveaux : une approche guidée par l’apprentissage automatique et les ontologies, 13 décembre 2024.
  2. Maxime GaideModélisation et rejeu basés sur des règles, le 11 décembre 2024.
  3. Chayma Sellami, Réseau social anonyme de confiance dédié aux applications communautaires du futur : une approche guidée par le capital social, le 12 décembre 2022.
  4. Louise ParkinTechniques coopératives pour l'exploitation des bases de connaissances et passage à l'échelle, 9 décembre 2022.  
  5. Ibrahim Dellal, Gestion et Exploitation de Larges Bases de Connaissances en Présence de Données Incomplètes et Incertaines, 10 décembre 2019. 
  6. Selma BouararVers une conception logique et physique des bases de données avancées dirigée par la variabilité, 13 décembre 2016
  7. Géraud Fokou, Conception d'un Framework pour la Relaxation des Requêtes SPARQL, 21 novembre 2016
  8. Bery Mbaiossoum, Conception physique des bases de données à base ontologique : le cas des vues matérialisées, 12 décembre 2014
  9. Ilyès Boukhari, Intégration et exploitation de besoins en entreprise étendue fondées sur la sémantique, 14 janvier 2014
  10. Youness Bazhar, Extension des Systèmes de Métamodélisation Persistant avec la Sémantique Comportementale, 13 décembre 2013