You are currently viewing «Analyse du modèle de popularité de l’utilisateur et de la prédiction d’engagement sur les réseaux sociaux en ligne»

«Analyse du modèle de popularité de l’utilisateur et de la prédiction d’engagement sur les réseaux sociaux en ligne»

Ecole doctorale EDITE – Ecole doctorale informatique, télécommunications et électronique et Télécom SudParis avec le Laboratoire de recherche SAMOVAR – Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux présentent l’AVIS DE SOUTENANCE de Madame Samin KARBALAY MOHAMMADI DASTJERDI Autorisée à présenter ses travaux en vue de l’obtention du Doctorat de Télécom SudParis avec l’Université Paris 6 en Informatique «Analyse du modèle de popularité de l’utilisateur et de la prédiction d’engagement sur les réseaux sociaux en ligne»

le 4 décembre 2018 à 9:00- Salle A003
Adresse : Télécom SudParis – 9 Rue Charles Fourier, 91000 Évry

Membres du jury :

Directeur de thèse Noël CRESPI- Professeur
Encadrant Reza FARAHBAKHSH – Chercheur – Télécom SudParis
Rapporteurs Markus FIEDLER – Professeur – Blekinge Tekniska Högskola University – Karlskrona, Suède
Rapporteurs Agata FILIPOWSKA – Assistant Professor – Université de Poznan – Pologne
Examinateurs Ioan Marius BILASCO – Maître de conférences – Université de Lille 1
Examinateurs Marie-Jeanne LESOT – Maître de conférences HDR – Sorbonne Université – Paris
Examinateurs Daqing ZHANG – Professeur – Télécom SudParis
Examinateurs Yacine GHAMRI-DOUDANE – Professeur – Université de La Rochelle – France

Résumé :

De nos jours, les médias sociaux ont largement affecté tous les aspects de la vie humaine. Le changement le plus significatif dans le comportement des gens après l’émergence des réseaux sociaux en ligne (OSNs) est leur méthode de communication et sa portée. Avoir plus de connexions sur les OSNs apporte plus d’attention et de visibilité aux gens, ou` cela s’appelle la popularité sur les médias sociaux. Selon le type de réseau social, la popularité se mesure par le nombre d’adeptes, d’amis, de retweets, de goûts et toutes les autres mesures qui servaient `a calculer l’engagement.

L’étude du comportement de popularité des utilisateurs et des contenus publiés sur les médias sociaux et la prédiction de leur statut futur sont des axes de recherche importants qui bénéficient `a différentes applications telles que les systèmes de recommandation, les réseaux de diffusion de contenu, les campagnes publicitaires, la prévision des résultats désélections, etc. Cette thèse porte sur l’analyse du comportement de popularité des utilisateurs d’OSN et de leurs messages publiés afin, d’une part, d’identifier les tendances de popularité des utilisateurs et des messages et, d’autre part, de prévoir leur popularité future et leur niveau d’engagement pour les messages publiés par les utilisateurs.

A cette fin, i) l’évolution de la popularité des utilisateurs de l’ONS est étudiée à l’aide d’un ensemble de données d’utilisateurs professionnels 8K Facebook collectées par un crawler avancé. L’ensemble de données collectées comprend environ 32 millions d’instantanés des valeurs de popularité des utilisateurs et 19 millions de messages publiés sur une période de 4 ans. Le regroupement des séquences temporelles des valeurs de popularité des utilisateurs a permis d’identifier des modèles d’évolution de popularité différents et intéressants. Les grappes identifiées sont caractérisées par l’analyse du secteur d’activité des utilisateurs, appelé catégorie, leur niveau d’activité, ainsi que l’effet des événements externes.

Ensuite ii) la thèse se concentre sur la popularité des contenus publiés par les utilisateurs sur les OSNs. Un nouveau modèle de prédiction est proposé qui tire parti de l’information mutuelle par points (PMI) et prédit la réaction future des utilisateurs aux messages nouvellement publiés. Enfin, iii) le modèle proposé est élargi pour tirer profit de l’apprentissage de la représentation et prévoir l’engagement futur des utilisateurs sur leurs postes respectifs. L’approche de prédiction proposée extrait l’intégration de l’utilisateur de son historique de réaction au lieu d’utiliser les méthodes conventionnelles d’extraction de caractéristiques. La performance du modèle proposé prouve qu’il surpasse les méthodes d’apprentissage conventionnelles disponibles dans la littérature.
Les modèles proposés dans cette thèse, non seulement déplacent les modèles de prédiction de réaction vers le haut pour exploiter les fonctions d’apprentissage de la représentation au lieu de celles qui sont faites `a la main, mais pourraient également aider les nouvelles agences, les campagnes publicitaires, les fournisseurs de contenu dans les CDN et les systèmes de recommandation `a tirer parti de résultats de prédiction plus précis afin d’améliorer leurs services aux utilisateurs.

ABSTRACT:

Nowadays, social media has widely affected every aspect of human life. The most significant change in people’s behavior after emerging Online Social Networks (OSNs) is their communication method and its range. Having more connections on OSNs brings more attention and visibility to people, where it is called popularity on social media. Depends on the type of social network, popularity is measured by the number of followers, friends, retweets, likes, and all those other metrics that used to calculate engagement. Studying the popularity behavior of users and published contents on social media and predicting its future status are the important research directions which benefit different applications such as recommender systems, content delivery networks, advertising campaign, election results prediction and so on. This thesis addresses analyzing the popularity behavior of OSN users and their published posts in order to first, identify the popularity trends of users and posts and second, predict their future popularity and engagement level for published posts by users.

To this end, i) the popularity evolution of ONS users is studied using a dataset of 8K Face- book professional users collected by an advanced crawler. The collected dataset includes around 32 million snapshots of users’ popularity values and 19 million published posts over a period of 4 years. Clustering temporal sequences of users’ popularity values led to identifying different and interesting popularity evolution patterns. The identified clusters are characterized by analyzing the users’ business sector, called category, their activity level, and also the effect of external events.

Then ii) the thesis focuses on the popularity of contents published by users on OSNs. A novel prediction model is proposed which takes advantage of Point-wise Mutual Information (PMI) and predicts users’ future reaction to newly published posts. Finally, iii) the proposed model is extended to get benefits of representation learning and predict users’ future engagement on each other’s posts. The proposed prediction approach extracts user embedding from their reaction history instead of using conventional feature extraction methods. The performance of the proposed model proves that it outperforms conventional learning methods available in the literature.
The models proposed in this thesis, not only move the reaction prediction models up to exploit representation learning features instead of hand-crafted ones but also could help new agencies, advertising campaigns, content providers in CDNs, and recommender systems to take advantage of more accurate prediction results in order to improve their user services.