Exploration des interactions humaines pour la modélisation de l’influence dans les réseaux sociaux

L’Ecole doctorale : Sciences et Technologies de l’Information et de la Communication
et le Laboratoire de recherche SAMOVAR

présentent l’AVIS DE SOUTENANCE de Madame Monika RAKOCZY

Autorisée à présenter ses travaux en vue de l’obtention du Doctorat de l’Université Paris-Saclay, préparé à Télécom SudParis en Informatique
« Exploration des interactions humaines pour la modélisation de l’influence dans les réseaux sociaux »

le VENDREDI 7 JUIN 2019 à 10h30

Salle A003

Télécom SudParis – 9 Rue Charles Fourier 91011 Evry

Membres du jury :

Mme Amel BOUZEGHOUB,
Professeure, Télécom SudParis, FRANCE
Directrice de thèse
Mme Katarzyna WEGRZYN-WOLSKA,
Professeure, EFREI Paris, FRANCE
Examinatrice
Mme Alda GANCARSKI LOPES,
Associate Professor, Télécom SudParis, FRANCE
Examinatrice
Mme Lynda TAMINE LECHANI,
Professeure, Paul Sabatier University, FRANCE
Rapporteur
M. Przemyslaw KAZIENKO,
Professeur, Wroclaw University of Technology, POLOGNE
Rapporteur
M. Cedric DU MOUZA,
Maître de Conférences, Conservatoire National des Art et Métiers, FRANCE
Examinateur
M. Bogdan CAUTIS,
Professeur, Université Paris-Sud, FRANCE
Examinateur
Mme Salima BENBERNOU,
Professeure, Université Paris-Descarte, FRANCE
Examinatrice

Résumé :

De nos jours, la popularité des réseaux sociaux (RS) est en constante progression. En effet, de plus en plus d’utilisateurs interagissent dans le monde virtuel, soit en y exprimant des opinions, en partageant des expériences, en réagissant aux avis d’autrui ou encore en échangeant des idées, en fonction de leurs qualités : influents, populaires, dignes de confiance, etc.. Dans la littérature, l’influence a fait l’objet d’une attention particulière ces dernières années. En effet, de nombreux domaines, dont l’Analyse des Réseaux Sociaux (ARS) et les systèmes de recommandation ont étudié l’influence, sa détection, la propagation de son effet et sa mesure. Ainsi, des modèles d’identification et d’estimation de l’influence sont aujourd’hui largement utilisés dans de nombreuses applications dédiées au marketing, aux campagnes politiques/sociales, etc. De plus, les interactions entre utilisateurs indiquent non seulement l’influence mais aussi la confiance, la popularité ou la réputation. Cependant, ces notions sont encore vaguement définies et il n’existe pas de consensus dans la communauté ARS. Définir, distinguer et mesurer la force de ces relations entre les utilisateurs posent également de nombreux défis, à la fois théoriques et pratiques, qui restent à explorer. La modélisation de l’influence pose de multiples défis et les méthodes actuelles de découverte et d’évaluation n’explorent pas encore pleinement les différents types d’interactions et ne sont en général pas applicables à plusieurs RS. En outre, la prise en compte de la dimension temporelle dans le modèle d’influence est importante, difficile et nécessite un examen plus approfondi. Enfin, l’exploration de liens possibles entre des notions, telles que l’influence et la réputation, reste un sujet ouvert. Dans cette thèse, nous nous focalisons sur les quatre concepts qualifiant les utilisateurs : influence, réputation, confiance et popularité, pour la modélisation de l’influence. Nous analysons les travaux existants utilisant ces notions et comparons leurs différentes interprétations. Par cette analyse, nous mettons en avant les caractéristiques essentielles que ces concepts devraient inclure, et nous en effectuons une analyse comparative. Cela nous permet d’établir une classification globale des différentes interprétations des notions selon leur niveau d’abstraction et leurs divergences ; cela constitue la première, contribution de cette thèse. En conséquence, nous proposons un modèle théorique de l’influence ainsi qu’une ontologie associée décrivant ce concept. Nous présentons également une variante de l’influence, inexplorée à ce jour dans le domaine de l’ARS, la micro-influence. Celle-ci cible un phénomène nouveau dans les RS que sont les utilisateurs avec une faible audience, mais fortement impliqués ; ces derniers apparaissent en effet comme ayant un impact fort malgré tout. En s’appuyant sur ces définitions, nous proposons ensuite un modèle pratique dénommé ARIM (Action-Reaction Influence Model). Ce modèle considère le type, la qualité, la quantité et la fréquence des actions réalisées par les utilisateurs, et ce en étant compatible avec différents RS. Nous abordons également la quantification de l’influence au cours du temps et la représentation de ses effets de causalité. Pour cela, nous considérons un type spécifique de RS: les réseaux de citations, particulièrement sensibles au temps. Ainsi, nous proposons un modèle, TiDIE (Time Dependent Influence Estimation), qui détermine l’influence, sur une période de temps, entre les communautés de ces réseaux. Enfin, nous combinons l’influence et la réputation avec le modèle TiDIE, afin d’étudier les dépendances entre elles. Nous proposons une méthode de transition, ReTiDIE, utilisant l’influence pour obtenir la réputation. Pour chacune de nos approches, des expérimentations ont été menées sur des jeux de données réels et ont montré la pertinence de nos méthodes.

Abstract :

Online social networks are constantly growing in popularity. They enable users to interact with one another and shifting their relations to the virtual world. Users utilize social media platforms as a mean for a rich variety of activities. Indeed, users are able to express their opinions, share experiences, react to other users’ views and exchange ideas. Such online human interactions take place within a dynamic hierarchy where we can observe and distinguish many qualities related to relations between users, concerning influential, trusted or popular individuals. In particular, influence within Social Networks (SN) has been a recent focus in the literature. Many domains, such as recommender systems or Social Network Analysis (SNA), measure and exploit users’ influence. Therefore, models discovering and estimating influence are important for current research and are useful in various disciplines, such as marketing, political and social campaigns, recommendations and others. Interestingly, interactions between users can not only indicate influence but also involve trust, popularity or reputation of users. However, all these notions are still vaguely defined and not meeting the consensus in the SNA community. Defining, distinguishing and measuring the strength of those relations between the users are also posing numerous challenges, on theoretical and practical ground, and are yet to be explored. Modelization of influence poses multiple challenges. In particular, current state-of-the-art methods of influence discovery and evaluation still do not fully explore users’ actions of various types, and are not adaptive enough for using different SN. Furthermore, adopting the time aspect into influence model is important, challenging and in need of further examination part of the research. Finally, exploring possible connections and links between coinciding notions, like influence and reputation, remains to be performed. In this thesis, we focus on the qualities of users connected to four important concepts: influence, reputation, trust, and popularity, in the scope of SNA for influence modeling. We analyze existing works utilizing these notions and we compare and contrast their interpretations. Consequently, we emphasize the most important features that these concepts should include and we make a comparative analysis of them. Accordingly, we present a global classification of the notions concerning their abstract level and distinction of the terms from one another, which is a first and required contribution of the thesis. Consequently, we then propose a theoretical model of influence and present influence-related ontology. We also present a distinction of notion not yet explored in SNA discipline — micro-influence, which targets new phenomena of users with a small but highly involved audience, who are observed to be still highly impactful. Basing on the definitions of the concepts, we propose a practical model, called Action-Reaction Influence Model (ARIM). This model considers type, quality, quantity, and frequency of actions performed by users in SN, and is adaptive to different SN types. We also focus on the quantification of influence over time and representation of influence causal effect. In order to do that, we focus on a particular SN with a specific characteristic – citation network. Indeed, citation networks are particularly time sensitive. Accordingly, we propose Time Dependent Influence Estimation (TiDIE), a model for determining influence during a particular time period between communities within time-dependent citation networks. Finally, we also combine two of the abovementioned notions, influence and reputation, in order to investigate the dependencies between them. In particular, we propose a transition method, ReTiDIE, that uses influence for predicting the reputation. For each of the proposed approaches, experiments have been conducted on real-world datasets and demonstrate the suitability of the methods.