Aller à l'en-tête Aller au menu principal Aller au contenu Aller au pied de page
Accueil - Recherche - Soutenances de Theses - Approximation dynamique de clusters dans un graphe social : Méthodes et Applications.

Approximation dynamique de clusters dans un graphe social : Méthodes et Applications.

Catégorie: 
Théses
Docteur :Monsieur Guillaume VIMONT
Date de la soutenance :24 Octobre 2019
Horaires :De 10h30 à 13h30
Adresse :Salle des Conseils Panthéon - 12, place du Panthéon - 75231 PARIS CEDEX 05
Discipline :Informatique
Ajouter au Calendrier 10/24/2019 10:30 10/24/2019 13:30 Europe/Paris Approximation dynamique de clusters dans un graphe social : Méthodes et Applications. Nous étudions comment détecter des clusters dans un graphe défini par un flux d’arêtes, sans stocker l'ensemble du graphe. Nous montrons comment détecter de gros clusters de l'ordre de $\sqrt{n}$ dans des graphes qui ont $m = O(n \log(n))$ arêtes, tout en stockant $\sqrt{n}.\log(n)$ arêtes. Les gra...
Adresse :Salle des Conseils Panthéon - 12, place du Panthéon - 75231 PARIS CEDEX 05
false MM/DD/YYYY
Jury :

Monsieur Michel DE ROUGEMONT - Professeur des Universités (Université Paris 2), directeur de thèse

Monsieur Christophe PRIEUR - Maître de Conférences HDR (Télécom Paris), rapporteur

Monsieur Kavé SALAMATIAN - Professeur des Universités (Université Savoie Mont Blanc - Polytech Annecy-Chambéry), rapporteur

Madame Céline CHEVALIER - Maître de Conférences HDR (Université Paris 2)

Monsieur Nicolas SPYRATOS - Professeur émérite d'université (Université Paris-Sud)

Nous étudions comment détecter des clusters dans un graphe défini par un flux d’arêtes, sans stocker l'ensemble du graphe. Nous montrons comment détecter de gros clusters de l'ordre de $\sqrt{n}$ dans des graphes qui ont $m = O(n \log(n))$ arêtes, tout en stockant $\sqrt{n}.\log(n)$ arêtes. Les graphes sociaux suivent le régime où $m$ satisfait cette condition. Nous étendons notre approche aux graphes dynamiques définis par les arêtes les plus récentes du flux et à plusieurs flux. Nous proposons des méthodes simples et robustes afin de détecter ces clusters de manière approchée.
Nous définissons la corrélation de contenu de deux flux $\rho(t)$ par la similarité de Jaccard de leurs clusters, dans les fenêtres au temps $t$. Nous proposons une méthode simple et efficace pour approcher cette corrélation en ligne et montrons que pour les graphes aléatoires dynamiques qui suivent une loi de puissance, nous pouvons garantir une bonne approximation.
Une des applications est l’analyse des flux Twitter. Nous calculons les corrélations de contenu de ces flux en ligne. Nous proposons ensuite une recherche par corrélation où les réponses aux ensembles de mots-clés sont entièrement basées sur les petites corrélations des flux. Les réponses sont ordonnées par les corrélations, et les explications peuvent être tracées avec les clusters stockés.