Edition 2015

L’Institut des Sciences de l’Homme de Lyon accueille

La 4ème édition des journées 
« Big Data Mining and Visualization »

Focus sur les Humanités Numériques dans le Big Data

Jeudi 18 et vendredi 19 juin 2015

2015

Institut des Sciences de l’Homme, 14 avenue Berthelot, Lyon 7ème

Recueil des résumés

Les groupes de travail de l’association EGC – « Fouille de Données Complexes » (GT-FDC), « Fouille de Grands Graphes » (GT-FGG) et « Visualisation d’informations, interaction et fouille de données » (GT-VIF, commun avec l’AFIHM) – organisent chaque année depuis trois ans des journées thématiques visant d’une part à poursuivre les activités des groupes et d’autre part à développer des axes communs autour de la complexité liée à la fouille et la visualisation des données massives (big data). Cette année, le nouveau groupe de travail «  Gestion et Analyse de données Spatiales et Temporelles » (GT-GAST) ainsi que le groupe de travail DMA de la SFdS rejoignent l’organisation de ces journées.

Les problématiques abordées lors de ces deux journées peuvent concerner les processus (acquisition, structuration, extraction d’information et de connaissances et la visualisation) ou les données elles-mêmes. L’objectif de ces journées est, d’une part, de rassembler l’ensemble des acteurs de la communauté scientifique intéressés par ces nouvelles approches de fouille de données massives pour susciter des interactions entre chercheurs et, d’autre part, d’animer et de dynamiser cette communauté. Pour ce faire, un appel à communications est donc lancé, et des personnes spécialistes de ces questions seront également invitées à présenter leurs travaux.

Pour cette nouvelle édition, un focus est fait sur les Humanités Numériques à l’ère du big data, mettant à l’honneur un champ pluridisciplinaire grâce à une articulation de l’informatique avec les Arts, Lettres, Sciences Humaines et Sciences Sociales et leurs productions scientifiques. Le numérique impacte très fortement toutes les recherches scientifiques. Les Arts, Lettres, Sciences Humaines et Sciences Sociales y trouvent un double intérêt. Le premier est d’ouvrir de nouveaux espaces de recherche impactant considérablement la manière d’effectuer ces recherches. Le second est de fournir à ces disciplines les moyens de participer aux innovations technologiques et scientifiques, de produire des biens et des services à forte valeur socio-économique et, par-delà à accroître leur apport dans la chaîne de création de valeur socio-économique et culturelle. L’édition numérique des sources ouvre des possibilités qui permettent de fixer des objectifs scientifiques qui vont au-delà de la diffusion, et invite les chercheurs et enseignants à s’emparer de nouvelles problématiques dans de multiples domaines. Elles rassemblent des informaticiens, des représentants des Sciences et Technologies de l’Information et de la Communication, et bien sûr des chercheurs du domaine des Arts, Lettres, Sciences Humaines et Sciences Sociales.

Ainsi, l’objectif de ces journées sera de créer un espace de rencontres et d’échanges sur les problématiques d’analyse et de visualisation de données massives, en particulier dans le contexte des humanités numériques, et ce dans leur définition non restrictive, recouvrant les Arts, les Lettres, les Sciences Humaines et les Sciences Sociales.

Dans ce cadre, la soumission de travaux s’intéressant à la fouille et la visualisation de big data est attendue. Des travaux pouvant être intéressants dans ce contexte d’humanités numériques sans qu’ils s’y inscrivent d’ores et déjà, seront les bienvenus. Par ailleurs, les travaux portant sur des données et des problématiques pour des chercheurs en Arts, Lettres, Sciences Humaines et Sciences Sociales soulevant des problématiques pouvant recourir à des besoins d’analyse et de fouille de grands volumes de données seront également les bienvenus. Des conférences invitées seront également programmées.

Programme

Jeudi 18 juin

08H30-9H15 Accueil et café d’accueil

9H15-9H30 Introduction aux journées par Djamel Zighed (directeur de l’ISH), Fabrice Guillet (président d’EGC) et Cécile Favre (coordinatrice de l’organisation des journées) 

9H30-10H30 Conférencier invité  Djamel A. Zighed (ISH) : « Les humanités numériques à l’ère du big et de l’open data » (Présidence de session : Julia Bonaccorsi)

10H30-12H00 Session 1 : Données textuelles (Présidence de session : Sabine Loudcher)

  • Adrien Guille, Michael Gauthier and Ciprian-Octavian Truică. How CATS can help researchers collect and analyze a corpus of tweets
  • Dario Compagno. Comprendre le partage des contenus journalistiques sur les réseaux socionumériques : enjeux, défis, compétences
  • Adrian Tanasescu. Analyse de l’interdisciplinarité dans la recherche scientifique

12H00-13H30 Repas

13H30-15H00  Conférencier invité  Guillaume Cabanac (IRIT, Université de Toulouse) : « Excursion en scientométrie : études quantitatives de la science à la croisée entre informatique, psychologie et sociologie » (Présidence de session : Cécile Favre)

15H00-15H30 Pause-café

15H30-16H30 Session 2 : Flux de données (Présidence de session : Pierrick Bruneau)

  • Aurélien Faravelon, Stephane Grumbach and Billel Lasledj. Voir dans le miroir des données
  • Mohammed Ghesmoune, Mustapha Lebbah and Hanane Azzag. Clustering over Data Streams based on Growing Neural Gas

16H30-18H00 Session 3 : Enjeux et limites du Big Data (Présidence de session : Nicolas Lachiche)

  • Linda Atif. Big Data : Dans quelle mesure leur recours peut-il améliorer la prise de décision RH ?
  • Sanaa Ait-Daoud and Hélène Tanghe. Enjeux éthiques et juridiques du Big Data Le cas de la Privacy By Design (PbD) : Limites et pistes de réflexion
  • Rafiqul Haque. On the road to searching facts about Big Data Technologies

Vendredi 19 juin

08H30-9H00 Accueil et café d’accueil

9H00-10H00 Session 4 : Données spatiales (Présidence de session : Cyril De Runz)

  • Giovanni Fusco and Cristina Cao. Représenter un clustering incertain de la spécialisation sociale. Le cas de l’aire métropolitaine azuréenne.
  • Sarah Zezasni, Eric Kergosien, Mathieu Roche and Maguelonne Teisseire. Une approche de fouille de textes pour l’identification automatique de relations spatiales

10H00-11H00 Session 5 : Données spatiotemporelles (Présidence de session : Lydia Boudjeloud)

  • Asma Gharbi, Cyril De Runz, Sami Faiz and Herman Akdag. Une approche à base de règles d’association pour la prédiction des évolutions de fonction de l’occupation du sol
  • Francesco Beretta. Exploration d’un corpus de notices biographiques : identification d’entités nommées, extraction de connaissances historiques et visualisation (SIG et réseaux) avec la méthode du projet symogih.org

11H00-11H30 Pause

11H30-13H00  Conférencier invité Christophe Cruz (Le2i, Université de Bourgogne) : « Approche sémantique pour la recommandation de documents textuels dans un contexte Big Data appliquée à la veille économique » (Présidence de session : Eric Kergosien)

13H00-14H30 : Repas

14H30-16H00 Session 6 : Données multimédia (Présidence de session : Fabien Picarougne)

  • Pierrick Bruneau, Mickaël Stefas and Thomas Tamisier. Visualisation interactive pour l’annotation automatique de locuteurs
  • Frédéric Rayar, Sabine Barrat, Fatma Bouali and Gilles Venturini. Construction d’un graphe de proximité pour l’exploration de larges collections d’images
  • Eric Masson, Shamshod Akmalov, Olivier Blanpain, Jean-Baptiste Litot, Hélène Melin, Antonio Dos Santos, Cyril Durant, Alain Leprêtre, Céline Pernin, Coralie Burrow, Francis Douay and Julie Leclercq. Environnements numériques de l’image – Images numériques de l’environnement

16H00-16H30 Discussion et clôture des journées

Comité d’organisation

Julia Bonaccorsi (ELICO, Université Lyon 2)
Cécile Favre (ERIC, Université Lyon 2)
Sonia Guerin-Hamdi (ISH, CNRS)
Sabine Loudcher (ERIC, Université Lyon 2)
Branislav Meszaros (ISH, Université Lyon 2)
Adrian Tanasescu (ISH, Université Lyon 2)
Djamel Zighed (ISH/ERIC, Université Lyon 2)

Comité de coordination

Correspondant EGC avec les groupes de travail :
Mustapha Lebbah (LIPN, Université Paris 13)

GT-FDC :
Cécile Favre (ERIC, Université Lyon 2)
Germain Forestier (MIPS, Université de Haute Alsace)
Camille Kurtz (LIPADE, Université Paris Descartes)

GT-FGG :
Lydia Boudjeloud (LITA, Université de Metz)
Mohamed Elati (iSSB, Université d’Evry)
Blaise Hanczar (LIPADE, Université Paris Descartes)

GT-GAST :
Thomas Guyet (IRISA, Agrocampus Ouest)
Eric Kergosien (GERIICO, Université Lille 3)
Cyril de Runz (CReSTIC, Université de Reims Champagne-Ardenne)

GT-VIF :
Hanene Azzag (LIPN, Université Paris 13)
David Bihanic (CALHISTE, Université de Valenciennes et du Hainaut-Cambrésis)
Monique Noirhomme (FUNDP, Namur, Belgique)
Fabien Picarougne (LINA, Université de Nantes)
Gilles Venturini (LI, Université de Tours)
Pierrick Bruneau (LIST, Luxembourg Institute of Science and Technology)