L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris
et le Laboratoire de recherche SAMOVAR – Services rĂ©partis, Architectures, ModĂ©lisation, Validation, Administration des RĂ©seaux
présentent
lâAVIS DE SOUTENANCE de Madame Meriana KOBEISSI
AutorisĂ©e Ă prĂ©senter ses travaux en vue de lâobtention du Doctorat de l’Institut Polytechnique de Paris, prĂ©parĂ© Ă TĂ©lĂ©com SudParis en :
Informatique
« Un cadre d’IA conversationnel pour l’analyse des processus cognitifs »
le JEUDI 21 DĂCEMBRE 2023 Ă 9h00
Ă
Amphithéùtre 2
19 place Marguerite Perey 91120 PALAISEAU
Zoom Link: https://telecom-paris.zoom.us/j/97992186985?pwd=SDlmTjRNZzdpdW45anRGMHlURG0rdz09
Meeting ID: 979 9218 6985
Passcode: 306290
Membres du jury :
M. Bruno DEFUDE, Professor, TĂ©lĂ©com SudParis, FRANCE – Directeur de these
M. Dirk FAHLAND, Professor, Eindhoven University of Technology (TU/e), PAYS-BAS – Rapporteur
M. Bassem HAIDAR, Professor, Ăcole supĂ©rieure d’informatique, Ă©lectronique, automatique (ESIEA), FRANCE – Directeur de these
M. Jan MENDLING, Professeur, Humboldt-UniversitĂ€t zu Berlin, ALLEMAGNE – Rapporteur
M. Phillipe MERLE, Directeur de recherche, Inria, FRANCE – Examinateur
Mme Amel BOUZEGHOUB, Professor, TĂ©lĂ©com SudParis, FRANCE – Examinateur
« Un cadre d’IA conversationnel pour l’analyse des processus cognitifs »
présenté par Madame Meriana KOBEISSI
Résumé :
Les processus mĂ©tier (BP) sont les piliers fondamentaux des organisations, englobant toute une gamme d’activitĂ©s structurĂ©es visant Ă atteindre des objectifs organisationnels distincts. Ces processus, caractĂ©risĂ©s par une multitude de tĂąches, d’interactions et de flux de travail, offrent une mĂ©thodologie structurĂ©e pour superviser les opĂ©rations cruciales dans divers secteurs. Une dĂ©couverte essentielle pour les organisations a Ă©tĂ© la reconnaissance de la valeur profonde inhĂ©rente aux donnĂ©es produites pendant ces processus. L’analyse des processus, une discipline spĂ©cialisĂ©e, explore ces journaux de donnĂ©es, facilitant une comprĂ©hension plus profonde et l’amĂ©lioration des BP. Cette analyse peut ĂȘtre catĂ©gorisĂ©e en deux perspectives : le niveau d’instance, qui se concentre sur les exĂ©cutions individuelles de processus, et le niveau de processus, qui examine le processus global. Cependant, l’application de l’analyse des processus pose des dĂ©fis aux utilisateurs, impliquant la nĂ©cessitĂ© d’accĂ©der aux donnĂ©es, de naviguer dans les API de bas niveau et d’utiliser des mĂ©thodes dĂ©pendantes d’outils. L’application dans le monde rĂ©el rencontre souvent des complexitĂ©s et des obstacles centrĂ©s sur l’utilisateur. Plus prĂ©cisĂ©ment, l’analyse de niveau d’instance exige des utilisateurs qu’ils accĂšdent aux donnĂ©es d’exĂ©cution de processus stockĂ©es, une tĂąche qui peut ĂȘtre complexe pour les professionnels de l’entreprise en raison de l’exigence de maĂźtriser des langages de requĂȘte complexes tels que SQL et CYPHER. En revanche, l’analyse de niveau de processus des donnĂ©es de processus implique l’utilisation de mĂ©thodes et d’algorithmes qui exploitent les donnĂ©es d’exĂ©cution de processus extraites des systĂšmes d’information. Ces mĂ©thodologies sont regroupĂ©es sous le terme de techniques d’exploration de processus. L’application de l’exploration de processus confronte les analystes Ă la tĂąche complexe de sĂ©lection de mĂ©thodes, qui consiste Ă trier des descriptions de mĂ©thodes non structurĂ©es. De plus, l’application des mĂ©thodes d’exploration de processus dĂ©pend d’outils spĂ©cifiques et nĂ©cessite un certain niveau d’expertise technique. Pour relever ces dĂ©fis, cette thĂšse prĂ©sente des solutions basĂ©es sur l’IA, mettant l’accent sur l’intĂ©gration de capacitĂ©s cognitives dans l’analyse des processus pour faciliter les tĂąches d’analyse tant au niveau de l’instance qu’au niveau du processus pour tous les utilisateurs. Les objectifs principaux sont doubles : premiĂšrement, amĂ©liorer l’accessibilitĂ© des donnĂ©es d’exĂ©cution de processus en crĂ©ant une interface capable de construire automatiquement la requĂȘte de base correspondante Ă partir du langage naturel. Ceci est complĂ©tĂ© par la proposition d’une technique de stockage adaptĂ©e et d’un langage de requĂȘte autour desquels l’interface doit ĂȘtre conçue. Ă cet Ă©gard, nous introduisons un mĂ©ta-modĂšle graphique basĂ© sur le graphe de propriĂ©tĂ©s Ă©tiquetĂ©es (LPG) pour le stockage efficace des donnĂ©es. DeuxiĂšmement, pour rationaliser la dĂ©couverte et l’accessibilitĂ© des techniques d’exploration de processus, nous prĂ©sentons une architecture orientĂ©e services. Pour valider notre mĂ©ta-modĂšle graphique, nous avons utilisĂ© deux ensembles de donnĂ©es de processus accessibles au public disponibles Ă la fois au format CSV et OCEL. Ces ensembles de donnĂ©es ont Ă©tĂ© essentiels pour Ă©valuer les performances de notre pipeline de requĂȘtes en langage naturel. Nous avons recueilli des requĂȘtes en langage naturel auprĂšs d’utilisateurs externes et en avons gĂ©nĂ©rĂ© d’autres Ă l’aide d’outils de paraphrase. Notre cadre orientĂ© services a Ă©tĂ© Ă©valuĂ© Ă l’aide de requĂȘtes en langage naturel spĂ©cialement conçues pour les descriptions de services d’exploration de processus. De plus, nous avons menĂ© une Ă©tude de cas avec des participants externes pour Ă©valuer l’expĂ©rience utilisateur et recueillir des commentaires. Nous fournissons publiquement les rĂ©sultats de l’Ă©valuation pour garantir la reproductibilitĂ© dans le domaine Ă©tudiĂ©.
Abstract :
Business processes (BP) are the foundational pillars of organizations, encapsulating a range of structured activities aimed at fulfilling distinct organizational objectives. These processes, characterized by a plethora of tasks, interactions, and workflows, offer a structured methodology for overseeing crucial operations across diverse sectors. A pivotal insight for organizations has been the discernment of the profound value inherent in the data produced during these processes. Process analysis, a specialized discipline, ventures into these data logs, facilitating a deeper comprehension and enhancement of BPs. This analysis can be categorized into two perspectives: instance-level, which focuses on individual process executions, and process-level, which examines the overarching process. However, applying process analysis in practice poses challenges for users, involving the need to access data, navigate low-level APIs, and employ tool-dependent methods. Real-world application often encounters complexities and user-centric obstacles. Specifically, instance-level analysis demands users to access stored process execution data, a task that can be intricate for business professionals due to the requirement of mastering complex query languages like SQL and CYPHER. Conversely, process-level analysis of process data involves the utilization of methods and algorithms that harness process execution data extracted from information systems. These methodologies collectively fall under the umbrella of process mining techniques. The application of process mining confronts analysts with the intricate task of method selection, which involves sifting through unstructured method descriptions. Additionally, the application of process mining methods depends on specific tools and necessitates a certain level of technical expertise. To address these challenges, this thesis introduces AI-driven solutions, with a focus on integrating cognitive capabilities into process analysis to facilitate analysis tasks at both the instance level and the process level for all users. The primary objectives are twofold: Firstly, to enhance the accessibility of process execution data by creating an interface capable of automatically constructing the corresponding database query from natural language. This is complemented by proposing a suitable storage technique and query language that the interface should be designed around. In this regard, we introduce a graph metamodel based on Labeled Property Graph (LPG) for efficient data storage. Secondly, to streamline the discovery and accessibility of process mining techniques, we present a service-oriented architecture. This architecture comprises three core components: an LPG meta-model detailing process mining methods, a service-oriented REST API design tailored for these methods, and a component adept at matching user requirements expressed in natural language with appropriate services. For the validation of our graph metamodel, we utilized two publicly accessible process datasets available in both CSV and OCEL formats. These datasets were instrumental in evaluating the performance of our NL querying pipeline. We gathered NL queries from external users and produced additional ones through paraphrasing tools. Our service-oriented framework underwent an assessment using NL queries specifically designed for process mining service descriptions. Additionally, we carried out a use case study with external participants to evaluate user experience and to gather feedback. We publically provide the evaluation results to ensure reproducibility in the studied area.