L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris

et le Laboratoire de recherche SAMOVAR – Services répartis, Architectures, Modélisation, Validation, Administration des Réseaux

présentent

l’AVIS DE SOUTENANCE de Madame Meriana KOBEISSI

Autorisée à présenter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, préparé à Télécom SudParis en :

Informatique

« Un cadre d’IA conversationnel pour l’analyse des processus cognitifs »

le JEUDI 21 DÉCEMBRE 2023 à 9h00

Amphithéâtre 2
19 place Marguerite Perey 91120 PALAISEAU

Zoom Link: https://telecom-paris.zoom.us/j/97992186985?pwd=SDlmTjRNZzdpdW45anRGMHlURG0rdz09
Meeting ID: 979 9218 6985
Passcode: 306290

Membres du jury :

M. Bruno DEFUDE, Professor, Télécom SudParis, FRANCE – Directeur de these
M. Dirk FAHLAND, Professor, Eindhoven University of Technology (TU/e), PAYS-BAS – Rapporteur
M. Bassem HAIDAR, Professor, École supérieure d’informatique, électronique, automatique (ESIEA), FRANCE – Directeur de these
M. Jan MENDLING, Professeur, Humboldt-Universität zu Berlin, ALLEMAGNE – Rapporteur
M. Phillipe MERLE, Directeur de recherche, Inria, FRANCE – Examinateur
Mme Amel BOUZEGHOUB, Professor, Télécom SudParis, FRANCE – Examinateur

« Un cadre d’IA conversationnel pour l’analyse des processus cognitifs »

présenté par Madame Meriana KOBEISSI

Résumé :

Les processus métier (BP) sont les piliers fondamentaux des organisations, englobant toute une gamme d’activités structurées visant à atteindre des objectifs organisationnels distincts. Ces processus, caractérisés par une multitude de tâches, d’interactions et de flux de travail, offrent une méthodologie structurée pour superviser les opérations cruciales dans divers secteurs. Une découverte essentielle pour les organisations a été la reconnaissance de la valeur profonde inhérente aux données produites pendant ces processus. L’analyse des processus, une discipline spécialisée, explore ces journaux de données, facilitant une compréhension plus profonde et l’amélioration des BP. Cette analyse peut être catégorisée en deux perspectives : le niveau d’instance, qui se concentre sur les exécutions individuelles de processus, et le niveau de processus, qui examine le processus global. Cependant, l’application de l’analyse des processus pose des défis aux utilisateurs, impliquant la nécessité d’accéder aux données, de naviguer dans les API de bas niveau et d’utiliser des méthodes dépendantes d’outils. L’application dans le monde réel rencontre souvent des complexités et des obstacles centrés sur l’utilisateur. Plus précisément, l’analyse de niveau d’instance exige des utilisateurs qu’ils accèdent aux données d’exécution de processus stockées, une tâche qui peut être complexe pour les professionnels de l’entreprise en raison de l’exigence de maîtriser des langages de requête complexes tels que SQL et CYPHER. En revanche, l’analyse de niveau de processus des données de processus implique l’utilisation de méthodes et d’algorithmes qui exploitent les données d’exécution de processus extraites des systèmes d’information. Ces méthodologies sont regroupées sous le terme de techniques d’exploration de processus. L’application de l’exploration de processus confronte les analystes à la tâche complexe de sélection de méthodes, qui consiste à trier des descriptions de méthodes non structurées. De plus, l’application des méthodes d’exploration de processus dépend d’outils spécifiques et nécessite un certain niveau d’expertise technique. Pour relever ces défis, cette thèse présente des solutions basées sur l’IA, mettant l’accent sur l’intégration de capacités cognitives dans l’analyse des processus pour faciliter les tâches d’analyse tant au niveau de l’instance qu’au niveau du processus pour tous les utilisateurs. Les objectifs principaux sont doubles : premièrement, améliorer l’accessibilité des données d’exécution de processus en créant une interface capable de construire automatiquement la requête de base correspondante à partir du langage naturel. Ceci est complété par la proposition d’une technique de stockage adaptée et d’un langage de requête autour desquels l’interface doit être conçue. À cet égard, nous introduisons un méta-modèle graphique basé sur le graphe de propriétés étiquetées (LPG) pour le stockage efficace des données. Deuxièmement, pour rationaliser la découverte et l’accessibilité des techniques d’exploration de processus, nous présentons une architecture orientée services. Pour valider notre méta-modèle graphique, nous avons utilisé deux ensembles de données de processus accessibles au public disponibles à la fois au format CSV et OCEL. Ces ensembles de données ont été essentiels pour évaluer les performances de notre pipeline de requêtes en langage naturel. Nous avons recueilli des requêtes en langage naturel auprès d’utilisateurs externes et en avons généré d’autres à l’aide d’outils de paraphrase. Notre cadre orienté services a été évalué à l’aide de requêtes en langage naturel spécialement conçues pour les descriptions de services d’exploration de processus. De plus, nous avons mené une étude de cas avec des participants externes pour évaluer l’expérience utilisateur et recueillir des commentaires. Nous fournissons publiquement les résultats de l’évaluation pour garantir la reproductibilité dans le domaine étudié.

Abstract :

Business processes (BP) are the foundational pillars of organizations, encapsulating a range of structured activities aimed at fulfilling distinct organizational objectives. These processes, characterized by a plethora of tasks, interactions, and workflows, offer a structured methodology for overseeing crucial operations across diverse sectors. A pivotal insight for organizations has been the discernment of the profound value inherent in the data produced during these processes. Process analysis, a specialized discipline, ventures into these data logs, facilitating a deeper comprehension and enhancement of BPs. This analysis can be categorized into two perspectives: instance-level, which focuses on individual process executions, and process-level, which examines the overarching process. However, applying process analysis in practice poses challenges for users, involving the need to access data, navigate low-level APIs, and employ tool-dependent methods. Real-world application often encounters complexities and user-centric obstacles. Specifically, instance-level analysis demands users to access stored process execution data, a task that can be intricate for business professionals due to the requirement of mastering complex query languages like SQL and CYPHER. Conversely, process-level analysis of process data involves the utilization of methods and algorithms that harness process execution data extracted from information systems. These methodologies collectively fall under the umbrella of process mining techniques. The application of process mining confronts analysts with the intricate task of method selection, which involves sifting through unstructured method descriptions. Additionally, the application of process mining methods depends on specific tools and necessitates a certain level of technical expertise. To address these challenges, this thesis introduces AI-driven solutions, with a focus on integrating cognitive capabilities into process analysis to facilitate analysis tasks at both the instance level and the process level for all users. The primary objectives are twofold: Firstly, to enhance the accessibility of process execution data by creating an interface capable of automatically constructing the corresponding database query from natural language. This is complemented by proposing a suitable storage technique and query language that the interface should be designed around. In this regard, we introduce a graph metamodel based on Labeled Property Graph (LPG) for efficient data storage. Secondly, to streamline the discovery and accessibility of process mining techniques, we present a service-oriented architecture. This architecture comprises three core components: an LPG meta-model detailing process mining methods, a service-oriented REST API design tailored for these methods, and a component adept at matching user requirements expressed in natural language with appropriate services. For the validation of our graph metamodel, we utilized two publicly accessible process datasets available in both CSV and OCEL formats. These datasets were instrumental in evaluating the performance of our NL querying pipeline. We gathered NL queries from external users and produced additional ones through paraphrasing tools. Our service-oriented framework underwent an assessment using NL queries specifically designed for process mining service descriptions. Additionally, we carried out a use case study with external participants to evaluate user experience and to gather feedback. We publically provide the evaluation results to ensure reproducibility in the studied area.

L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Pariset le Laboratoire de recherche SAMOVAR – Services répartis, Architectures, Modélisation, Validation, Administration des Réseaux

l’AVIS DE SOUTENANCE de Madame Meriana KOBEISSI

Informatique

« Un cadre d’IA conversationnel pour l’analyse des processus cognitifs »

« Un cadre d’IA conversationnel pour l’analyse des processus cognitifs »

présenté par Madame Meriana KOBEISSI

L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris

et le Laboratoire de recherche SAMOVAR – Services répartis, Architectures, Modélisation, Validation, Administration des Réseaux