Edition 2016

La 5ème édition des journées 
« Big Data Mining and Visualization »

Logo_IUT_Metz.ULlabos-LITA

Les 23-24 juin 2016 à Metz

IUT de Metz – Ile du Saulcy (Amphi A)

/!\ S’inscrire aux journées /!\

sogeti_varmred_cmykImprimerlogo-DATAOBSERVER-RVBFinal_NUAGE_GRIS_85

Conférenciers invités :

  • Christophe Hurter, (ENAC Ecole Nationale de l’Aviation Civile – Toulouse) :  ”Interactive Multidimensionnel Data Exploration”

    Résumé :

    Je suis actuellement enseignant chercheur à l’ENAC. Ma recherche et mes enseignements s’articulent autour de la visualisation interactive de données. Je travaille depuis plus de 20 ans dans le domaine aéronautique. J’ai aujourd’hui l’opportunité de partager mes connaissances avec des étudiants du monde entier et aussi avec les acteurs académiques et les professionnels du domaine.
    Auparavant, la collecte et le stockage de données soulevaient de nombreux problèmes techniques. Aujourd’hui, la recherche s’intéresse à l’exploitation de ces grandes quantités de données (Big Data) pour en extraire des connaissances. Mes travaux s’articulent autour d’une nouvelle piste de recherche ; l’utilisateur devient l’acteur principal pour l’exploration des données avec, comme outil, la visualisation interactive : Image-Based visualization. L’utilisateur exploite ainsi l’ordinateur pour sa puissance de calcul et d’affichage. Toutefois l’extraction de connaissances et la prise de décision reste à sa charge.

  • Ahcène Bounceur, (Lab-STICC -Université de Bretagne Occidentale) : “CupCarbon: A New Platform for Designing and Simulating Smart-City & IoT Wireless Sensor Networks”Résumé :

    The proliferation of radio communication systems and the significant advances in enabling device technologies are paving towards Internet-of-Things (IoT) and opening new horizons for Smart City applications and its services. Such evolution becomes essential in order to enhance quality of urban services, to reduce costs, and to engage citizens more actively. In this context, novel simulation tools are required to prepare the future deployments of large-scale IoT infrastructure for Smart cities in the best conditions in terms of reliability, energy consumption, and cost. This demo session presents the CupCarbon1 framework: a platform for designing smart-city Wireless Sensor Networks. CupCarbon aims to provide following benefits that makes it significant from the other conventional wireless sensor network simulators.
    (1) provides modeling and simulation of radio propagation channel and alpha-stable noise based interferences in more realistic way,
    (2) takes into account the deployment environment and quantify the uncertainty of simulations,
    (3) allows the visualization of mobile nodes and dynamic environments,
    (4) allows the behavioural study of a network or networks with large number of nodes in practical environments (city, mountain, etc.).

  • Yanik Ngoko, (Qarnot Computing) : “Une approche d’Edge Computing pour la décentralisation de l’Internet des Objets”Résumé :

    A l’horizon 2020, les prédictions annoncent plusieurs dizaines de milliards d’objets connectes dans le monde. Ceci pourrait entraîner une véritable révolution dans les domaines de ’intelligence ambiante, à condition de formuler des architectures systèmes, efficaces dans le traitement des données produites ou requises par les objets connectes. La question de l’organisation distribuée adéquate pour la création des systèmes intelligents à base d’objets connectes a beaucoup été étudiée ces dernières années. Elle a majoritairement été envisagée sous des modèles centralisés. Ici, l’intelligence ambiante est produite à partir d’un centre de données auquel sont connectés des objets de l’environnement ambiant. Si ce modèle est très facile à implémenter, il a de nombreux inconvénients au niveau de l’engorgement des réseaux, de la confidentialité ou du traitement temps réel. La thèse principale de cette présentation est que ‘accroissement de la masse des objets connectés implique de formuler des plateformes décentralisées pour l’Internet des objets. Cette présentation discute de deux approches qui sont alors envisageables. La première s’inspire des nouvelles solutions pairs à pairs prônée par les systèmes de crypto-monnaies. Pour celle-ci nous présentons les concepts de base ainsi que des cas d’application pour l’économie collaborative. Dans la seconde, il s’agit de construire des mini-centres de données à la périphérie d’Internet (Edge Computing). Nous nous focalisons sur ce cas et discutons de l’application de ce modèle pour la construction des villes et maisons intelligente. Pour terminer, nous discutons d’un système de détection des anomalies dans une maison intelligente équipée d’une plateforme d’edge computing, opérée par les radiateurs numériques de la société Qarnot Computing. Ce cas d’application conduit à des questions intéressantes tant au niveau de la construction des modèles d’apprentissage que du stockage des données.


Programme

Jeudi 23 juin

  • 9H30-10H00 Accueil et café
  • 10H00-10H15 Introduction aux journées
  • 10H15-11H15 Conférencier invité Ahcène Bounceur, (Lab-STICC -Université de Bretagne Occidentale) : “CupCarbon: A New Platform for Designing and Simulating Smart-City & IoT Wireless Sensor Networks” (Présidence de session Lydia Boudjeloud)

11H15-12H15 Session 1 : Données complexes (Présidence de session Germain Forestier)

14H00-16H00 Session 2 : Données massives (Présidence de session Cyril de Runz)

  • 14H – 14H30 Massinissa Saoudi, Massinissa Lounis, Ahcène Bounceur, Reinhardt Euler and Tahar Kechadi. A Parallel Data Mining Algorithm for PageRank Computation
  • 14H30-15H00 Ahmed Masmoudi, Lobna Bouchaala, Mounir Ben Ayed, Apprentissage automatique à partir des données massives pour un système d’aide à la décision médicale : Application pour le diagnostic précoce de la maladie d’Alzheimer
  • 15H00 – 15H30 Francesca Iannuzzi and Franck Avenel, Territorial Watch for the Public Administration
  • 15H30 – 16H00 Discussion autour d’un café
  • 16h00-17h00 Cyril De Runz : EGC 2017 et défi

Vendredi 24 juin

11H00-12H00 Session 3 : Visualisation de données (Présidence de session Brieuc Conan-Guez)

15H00- 17H00 Session 4 : Industriels (Présidence de session Alain Gély)

  • 15H00- 15H30 Jean-Valère Cossu and Christophe Navas. Vodkaster, applications small et big data analytics
  • 15H30-16H00 Carlos Sanin Quiroz. Clustering de données Twitter pour l’analyse des cycles de vie des articles de médias
  • 16h00-16h30 Ibrahim Louhi, Lydia Boudjeloud and Thomas Tamisier. Clustering de Données Massives par Approches de Flux de Données
  • 16H30-17H00 Discussion et clôture des journées

Les groupes de travail de l’association EGC – « Fouille de Données Complexes » (GT-FDC), « Grands raphes et Bioinformatique » (GT-GGB), « Visualisation d’informations, interaction et fouille de données » (GT-VIF, commun avec l’AFIHM), « Gestion et Analyse de données Spatiales et Temporelles » (GT-GAST) ainsi que le groupe de travail DMA de la SFdS, organisent chaque année depuis quatre ans des journées thématiques visant d’une part à poursuivre les activités des groupes et d’autre part à développer des axes communs autour de la complexité liée à la fouille et la visualisation des données massives (big data).

Les problématiques abordées lors de ces deux journées peuvent concerner les processus (acquisition, structuration, extraction d’information et de connaissances et la visualisation) ou les données elles-mêmes. L’objectif de ces journées est, d’une part, de rassembler l’ensemble des acteurs de la communauté scientifique intéressés par ces nouvelles approches de fouille de données massives pour susciter des interactions entre chercheurs et, d’autre part, d’animer et de dynamiser cette communauté. Pour ce faire, un appel à communications est donc lancé, et des personnes spécialistes de ces questions seront également invitées à présenter leurs travaux.

Pour cette nouvelle édition, un focus est fait sur l’extraction, la gestion et la visualisation de d’information pour les villes intelligentes (Smart Cities) et l’internet des objets (Internet of Things) avec une session spéciale sur cette thématique.

Une « ville intelligente » se veut être une ville qui tire parti au maximum des données disponibles pour sa gestion. La tendance de fond est de privilégier la production, l’utilisation (ou la ré-utilisation) et la valorisation des données afin d’avoir une meilleure connaissance de la situation globale et de pouvoir décider plus vite et plus efficacement. Les données utilisables sont produites aussi bien par les citoyens et visiteurs des cités que par les infrastructures et process-métiers. Ainsi, les nouvelles technologies, dont l’utilisation de plus en plus importante de capteurs et d’objets connectés (IoT, Internet of Thing) doivent aider au pilotage et à l’amélioration de la ville. Des domaines variés sont concernés, dont en particulier l’économie, la mobilité, l’environnement, le mode de vie et la gestion de la cité. Les exemples abondent, du suivi en temps réel de la consommation énergétique des quartiers via des compteurs intelligents à la découverte de flux pendulaires depuis la localisation des vélos et voitures en libre accès (autolib et vélib) en passant par l’estimation de l’attractivité d’un site depuis les données de téléphonie mobile.

Les nouveaux challenges ne manquent pas : Comment inventorier, cartographier les sources de données disponibles ? Comment les intégrer dans des projets plus vastes ? Quelles sont les méthodes à appliquer pour les transformer en information pertinente, non triviale mais aisément compréhensible par les décideurs ou les citoyens eux-mêmes ?

L’hétérogénéité des types de données à disposition (données de géo localisation, avis citoyens, éléments connectés, information administrative, etc.), leur masse à l’échelle d’une cité, la manière dont elles sont produites en continue, leur communication à la multiplicité des acteurs devant rendre des décisions sont autant d’axes de recherche à explorer. Il est également important d’intégrer le décideur dans le processus de façon active à travers les outils visuels et interactifs.

Pour ces journées, la soumission de travaux s’intéressant à la fouille et la visualisation de Big Data est attendue. Des travaux portant sur des données et des problématiques pour des chercheurs de thématiques soulevant des problématiques pouvant recourir à des besoins d’analyse, de fouille et de visualisation de grands volumes de données seront les bienvenus. Des conférences invitées seront également programmées.

Procédure de soumission :

Si vous souhaitez faire une présentation, merci de soumettre votre résumé comprenant 2 pages
maximum au format RNTI (http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip) incluant quelques
références bibliographiques avant le lundi 9 mai 2016 (notification le 17 mai 2016), sur le site :

https://easychair.org/conferences/?conf=bdmvegc2016

Les présentations pourront durer 30 min (questions comprises) et concerner : vos travaux récents, une présentation de synthèse de votre équipe, les résultats d’une thèse en cours, des données sur lesquelles vous travaillez, des présentations de projets en cours, etc. Un intérêt particulier est porté aux travaux menés par les doctorants.

L’inscription est gratuite mais obligatoire avant le lundi 20 mai 2016 : cliquez ici pour vous inscrire.

Dates importantes :

  • Soumission :      30 mai 2016
  • Notification :    3 juin 2016
  • Inscription :     14 juin 2016

Comité d’organisation :

  • Lydia Boudjeloud-Assala (LITA – Université de Lorraine)
  • Alain Gély (LITA – Université de Lorraine)
  • Brieuc Conan-Guez (LITA – Université de Lorraine)
  • Alexandre Blansché (LITA – Université de Lorraine)

Comité de coordination :

Correspondant EGC avec les groupes de travail :

  • Mustapha Lebbah (LIPN, Université Paris 13)

GT-FDC :

  • Cécile Favre (ERIC, Université Lyon 2)
  • Germain Forestier (MIPS, Université de Haute Alsace)
  • Camille Kurtz (LIPADE, Université Paris Descartes)

GT-GGB :

  • Etienne Birmelé,  (MAP5 – Université Paris Descartes)
  • Mohamed Elati (iSSB – Université Evry Val d’Essonne)
  • Blaise Hanczar (IBISC -  Université Evry Val d’Essonne)

GT-GAST :

  • Thomas Guyet (IRISA, Agrocampus Ouest)
  • Eric Kergosien (GERIICO, Université Lille 3)
  • Cyril de Runz (CReSTIC, Université de Reims Champagne-Ardenne)

GT-VIF :

  • Hanene Azzag (LIPN, Université Paris 13)
  • David Bihanic (CALHISTE, Université de Valenciennes et du Hainaut-Cambrésis)
  • Monique Noirhomme (FUNDP, Namur, Belgique)
  • Fabien Picarougne (LINA, Université de Nantes)
  • Gilles Venturini (LI, Université de Tours)