Avis de soutenance de Madame Meriana KOBEISSI

L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris

et le Laboratoire de recherche SAMOVAR – Services rĂ©partis, Architectures, ModĂ©lisation, Validation, Administration des RĂ©seaux

présentent

l’AVIS DE SOUTENANCE de Madame Meriana KOBEISSI

AutorisĂ©e Ă  prĂ©senter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, prĂ©parĂ© Ă  TĂ©lĂ©com SudParis en :

Informatique

« Un cadre d’IA conversationnel pour l’analyse des processus cognitifs »

le JEUDI 21 DÉCEMBRE 2023 Ă  9h00

Ă 

Amphithéâtre 2
19 place Marguerite Perey 91120 PALAISEAU

Zoom Link: https://telecom-paris.zoom.us/j/97992186985?pwd=SDlmTjRNZzdpdW45anRGMHlURG0rdz09
Meeting ID: 979 9218 6985
Passcode: 306290

Membres du jury :

M. Bruno DEFUDE, Professor, TĂ©lĂ©com SudParis, FRANCE – Directeur de these
M. Dirk FAHLAND, Professor, Eindhoven University of Technology (TU/e), PAYS-BAS – Rapporteur
M. Bassem HAIDAR, Professor, École supĂ©rieure d’informatique, Ă©lectronique, automatique (ESIEA), FRANCE – Directeur de these
M. Jan MENDLING, Professeur, Humboldt-Universität zu Berlin, ALLEMAGNE – Rapporteur
M. Phillipe MERLE, Directeur de recherche, Inria, FRANCE – Examinateur
Mme Amel BOUZEGHOUB, Professor, TĂ©lĂ©com SudParis, FRANCE – Examinateur

« Un cadre d’IA conversationnel pour l’analyse des processus cognitifs »

présenté par Madame Meriana KOBEISSI

Résumé :

Les processus mĂ©tier (BP) sont les piliers fondamentaux des organisations, englobant toute une gamme d’activitĂ©s structurĂ©es visant Ă  atteindre des objectifs organisationnels distincts. Ces processus, caractĂ©risĂ©s par une multitude de tâches, d’interactions et de flux de travail, offrent une mĂ©thodologie structurĂ©e pour superviser les opĂ©rations cruciales dans divers secteurs. Une dĂ©couverte essentielle pour les organisations a Ă©tĂ© la reconnaissance de la valeur profonde inhĂ©rente aux donnĂ©es produites pendant ces processus. L’analyse des processus, une discipline spĂ©cialisĂ©e, explore ces journaux de donnĂ©es, facilitant une comprĂ©hension plus profonde et l’amĂ©lioration des BP. Cette analyse peut ĂŞtre catĂ©gorisĂ©e en deux perspectives : le niveau d’instance, qui se concentre sur les exĂ©cutions individuelles de processus, et le niveau de processus, qui examine le processus global. Cependant, l’application de l’analyse des processus pose des dĂ©fis aux utilisateurs, impliquant la nĂ©cessitĂ© d’accĂ©der aux donnĂ©es, de naviguer dans les API de bas niveau et d’utiliser des mĂ©thodes dĂ©pendantes d’outils. L’application dans le monde rĂ©el rencontre souvent des complexitĂ©s et des obstacles centrĂ©s sur l’utilisateur. Plus prĂ©cisĂ©ment, l’analyse de niveau d’instance exige des utilisateurs qu’ils accèdent aux donnĂ©es d’exĂ©cution de processus stockĂ©es, une tâche qui peut ĂŞtre complexe pour les professionnels de l’entreprise en raison de l’exigence de maĂ®triser des langages de requĂŞte complexes tels que SQL et CYPHER. En revanche, l’analyse de niveau de processus des donnĂ©es de processus implique l’utilisation de mĂ©thodes et d’algorithmes qui exploitent les donnĂ©es d’exĂ©cution de processus extraites des systèmes d’information. Ces mĂ©thodologies sont regroupĂ©es sous le terme de techniques d’exploration de processus. L’application de l’exploration de processus confronte les analystes Ă  la tâche complexe de sĂ©lection de mĂ©thodes, qui consiste Ă  trier des descriptions de mĂ©thodes non structurĂ©es. De plus, l’application des mĂ©thodes d’exploration de processus dĂ©pend d’outils spĂ©cifiques et nĂ©cessite un certain niveau d’expertise technique. Pour relever ces dĂ©fis, cette thèse prĂ©sente des solutions basĂ©es sur l’IA, mettant l’accent sur l’intĂ©gration de capacitĂ©s cognitives dans l’analyse des processus pour faciliter les tâches d’analyse tant au niveau de l’instance qu’au niveau du processus pour tous les utilisateurs. Les objectifs principaux sont doubles : premièrement, amĂ©liorer l’accessibilitĂ© des donnĂ©es d’exĂ©cution de processus en crĂ©ant une interface capable de construire automatiquement la requĂŞte de base correspondante Ă  partir du langage naturel. Ceci est complĂ©tĂ© par la proposition d’une technique de stockage adaptĂ©e et d’un langage de requĂŞte autour desquels l’interface doit ĂŞtre conçue. Ă€ cet Ă©gard, nous introduisons un mĂ©ta-modèle graphique basĂ© sur le graphe de propriĂ©tĂ©s Ă©tiquetĂ©es (LPG) pour le stockage efficace des donnĂ©es. Deuxièmement, pour rationaliser la dĂ©couverte et l’accessibilitĂ© des techniques d’exploration de processus, nous prĂ©sentons une architecture orientĂ©e services. Pour valider notre mĂ©ta-modèle graphique, nous avons utilisĂ© deux ensembles de donnĂ©es de processus accessibles au public disponibles Ă  la fois au format CSV et OCEL. Ces ensembles de donnĂ©es ont Ă©tĂ© essentiels pour Ă©valuer les performances de notre pipeline de requĂŞtes en langage naturel. Nous avons recueilli des requĂŞtes en langage naturel auprès d’utilisateurs externes et en avons gĂ©nĂ©rĂ© d’autres Ă  l’aide d’outils de paraphrase. Notre cadre orientĂ© services a Ă©tĂ© Ă©valuĂ© Ă  l’aide de requĂŞtes en langage naturel spĂ©cialement conçues pour les descriptions de services d’exploration de processus. De plus, nous avons menĂ© une Ă©tude de cas avec des participants externes pour Ă©valuer l’expĂ©rience utilisateur et recueillir des commentaires. Nous fournissons publiquement les rĂ©sultats de l’Ă©valuation pour garantir la reproductibilitĂ© dans le domaine Ă©tudiĂ©.


Abstract :

Business processes (BP) are the foundational pillars of organizations, encapsulating a range of structured activities aimed at fulfilling distinct organizational objectives. These processes, characterized by a plethora of tasks, interactions, and workflows, offer a structured methodology for overseeing crucial operations across diverse sectors. A pivotal insight for organizations has been the discernment of the profound value inherent in the data produced during these processes. Process analysis, a specialized discipline, ventures into these data logs, facilitating a deeper comprehension and enhancement of BPs. This analysis can be categorized into two perspectives: instance-level, which focuses on individual process executions, and process-level, which examines the overarching process. However, applying process analysis in practice poses challenges for users, involving the need to access data, navigate low-level APIs, and employ tool-dependent methods. Real-world application often encounters complexities and user-centric obstacles. Specifically, instance-level analysis demands users to access stored process execution data, a task that can be intricate for business professionals due to the requirement of mastering complex query languages like SQL and CYPHER. Conversely, process-level analysis of process data involves the utilization of methods and algorithms that harness process execution data extracted from information systems. These methodologies collectively fall under the umbrella of process mining techniques. The application of process mining confronts analysts with the intricate task of method selection, which involves sifting through unstructured method descriptions. Additionally, the application of process mining methods depends on specific tools and necessitates a certain level of technical expertise. To address these challenges, this thesis introduces AI-driven solutions, with a focus on integrating cognitive capabilities into process analysis to facilitate analysis tasks at both the instance level and the process level for all users. The primary objectives are twofold: Firstly, to enhance the accessibility of process execution data by creating an interface capable of automatically constructing the corresponding database query from natural language. This is complemented by proposing a suitable storage technique and query language that the interface should be designed around. In this regard, we introduce a graph metamodel based on Labeled Property Graph (LPG) for efficient data storage. Secondly, to streamline the discovery and accessibility of process mining techniques, we present a service-oriented architecture. This architecture comprises three core components: an LPG meta-model detailing process mining methods, a service-oriented REST API design tailored for these methods, and a component adept at matching user requirements expressed in natural language with appropriate services. For the validation of our graph metamodel, we utilized two publicly accessible process datasets available in both CSV and OCEL formats. These datasets were instrumental in evaluating the performance of our NL querying pipeline. We gathered NL queries from external users and produced additional ones through paraphrasing tools. Our service-oriented framework underwent an assessment using NL queries specifically designed for process mining service descriptions. Additionally, we carried out a use case study with external participants to evaluate user experience and to gather feedback. We publically provide the evaluation results to ensure reproducibility in the studied area.