Regroupement de données avec des graphes¶
Présentation du problème fil rouge et règles du jeu¶
Fil rouge¶
Le problème traité dans ce cours est le suivant :
Quels sont les profils de compétences principaux que l’on peut trouver parmi les étudiants d’ESIEE Paris ?
Pour cela, nous souhaitons analyser la listes des étudiants inscrits dans chaque unité d’ESIEE Paris et regrouper les unités ayant un grand nombre d’étudiants en commun. L’idée étant que plusieurs unités qui ont une proportion importante d’étudiants en commun participent probablement à un même parcours de compétences.
Organisation du cours¶
Cette partie du cours n’est pas encore complètement opérationnelle sous forme d’atelier :-(
Le cours est organisé en trois parties.
La première consiste à répondre à une série d’exercices qui vous fera découvrir une méthode de regroupement de données reposant sur la notion de composante \(k\)-liée, où \(k\) est un paramètre permettant de spécifier la quantité désirée de liaisons entre les données regroupées.
Dans la seconde partie vous devrez indiquer comment modéliser les données du problème fil rouge par un graphe et comment l’on peut le résoudre avec les notions et algorithmes abordés en exercice.
Dans la troisième partie, que nous n’aurons probablement pas le temps de traiter cette année :-(, il s’agira d’implémenter la méthode et de l’appliquer aux données réelles d’ESIEE Paris.
Dans cette partie vous continuez à travailler par groupe de quatre et à consigner vos réponses dans votre rapport (un rapport par groupe).
Exercices : cyber-profiler et composantes \(k\)-liées¶
Télécharger le document ci-dessous et répondez aux questions dans votre rappport: