Edition 2014

Le lundi 23 et le mardi 24 juin 2014 à Lille

280px-Lille_vue_gd_place gdr_LOGO

Journées des groupes de travail EGC
avec une session spéciale Big Data et Santé
co-organisée avec le thème e-Santé du GDR STIC-Santé

Université de Lille 2,
Pôle recherche de la Faculté de Médecine (CERIM), Amphithéâtre A
http://cerim.univ-lille2.fr/plan-dacces.html

Sponsors :
Pôle math-STIC de l’université Paris 13
logo_square_predict ulille
iutlille arrow

Les groupes de travail de l’association EGC : « Fouille de Données Complexes » (GT-FDC), « Fouille de Grands Graphes » (GT-FGG) et « Visualisation d’informations, interaction et fouille de données » (GT-VIF, commun avec l’AFIHM) organisent chaque année depuis deux ans des journées thématiques visant d’une part à poursuivre les activités des groupes et d’autre part à développer des axes communs autour de la complexité liée à la fouille des données massives.

Cette 3e édition est co-organisée avec le thème e-Santé du GDR STIC-Santé (www.stic-sante.org). Une session sera consacrée aux problématiques de Big Data et Santé.

Les problématiques abordées lors de ces deux journées peuvent concerner les processus (acquisition, structuration, extraction d’information et de connaissances et la visualisation) ou les données elles-mêmes. L’objectif de ces journées est de rassembler l’ensemble des acteurs de la communauté scientifique intéressés par ces nouvelles approches de la fouille de données massives (Big Data) afin de susciter des interactions entre chercheurs du domaine et d’animer/de dynamiser cette communauté. Des conférenciers invités présentent également leurs travaux.

Si vous êtes intéressé par faire une présentation nous vous prions de suivre les instructions ci-dessous. Les présentations pourront durer 30 min (questions comprises) et concerner : vos travaux récents, une présentation de synthèse de votre équipe, les résultats d’une thèse en cours, des données sur lesquelles vous travaillez, des présentations de projets en cours, etc. Un intérêt particulier est porté aux travaux menés par les doctorants.

Programme
____________________________

Lundi  23 juin

09H00-10H00 Accueil et petit-déjeuner

10H00-11H00 Conférencier invité  Joël Colloc : Aspects éthiques et impact social de l’utilisation du Big Data en santé

11H00-11H30 Visualisation des connaissances et de l’information en utilisant la technique des îles de mémoires. Bin Yang and Jean-Gabriel Ganascia.

11H30-12H00 Visualisation des Modèles de Mélange. Serge Iovleff, Christophe Biernacki and Vincent Vandewalle.

12H00-12H30 Un assistant utilisateur en ligne pour la fouille visuelle de données. Fatma Bouali and Gilles Venturini.

12H30-14H00 Repas

14H00-15H00  Conférencier invité  Sihem Amer-Yahia : Big (User) (Health) Data Management

15H00-15H30 Clustering and visualization over data stream. Mohammed Ghesmoune, Hanene Azzag and Mustapha Lebbah.

15H30-16H00 Gestion de données RDF: incertain et Big data Huang Xin, Benbernou Salima and Ouziri Mourad.

16H00-16H30 Clustering algorithms for large complex networks. Attal Jean-Philippe and Maria Malek.

16H30 Discussions autour d’un café

Mardi 24 juin

09H00-10H00  Conférencier invité Marc Cuggia : Outils de recherche et de fouille réexploitant les données patients à des fins de recherche biomédicales

10H00-10H30 Intégration et fouille de données biologiques ouvertes – Application à l’analyse de gènes responsables d’une maladie. Gabin Personeni, Simon Daget, Céline Bonnet, Philippe Jonveaux, Marie-Dominique Devignes, Malika Smail-Tabbone and Adrien Coulet.

10H30-11H00A Visualization Algorithm for Facial Paralysis Patients States Evolution, Jalel Akaichi

11H00-11H30 : Pause

11H30-12H00 Modélisation par règles de propagation au sein de réseaux. Jason Vallet, Bruno Pinaud and Guy Melançon.

12H00-12H30 Analyse de communautés locales dans les réseaux sociaux dynamiques et distribués. Blaise Ngonmang.

12H30-14H00 : Repas

14H00-14H30 Projet Camomile : visualisation interactive d’annotations de documents multimédia. Pierrick Bruneau, Hervé Bredin, Mickaël Stefas and Thomas Tamisier.

14H30-15H00 Execution traces analysis. Christiane Kamdem.

15H00-15H30 Utilisation massive de classifieurs supervisés pour les Big Data sur le Cloud : une approche combinant MapReduce et SMA. Rabah Mazouzi, Cyril De Runz and Herman Akdag.

15H30-16H00 Vers une coordination d’équipes de secours lors de situations de crise : un algorithme ACO prometteur. Jason Mahdjoub and Francis Rousseaux.

16H00-16H30 Discussion et clôture des journées

Dates importantes
____________________________
Date limite de soumission : 11 mai    19  mai 2014

Soumission d’un résumé de 2 pages  maximum avec quelques références (format RNTI), soumis via le site easychair.

Notification : 1 juin 2014

L’inscription est gratuite mais obligatoire avant le 06 juin 2014.

Pour vous inscrire c’est ici.

Conférenciers invités
______________________________

Marc Cuggia (PU-PH, CHU de RENNES, Faculté de Médecine, Univ. RENNES 1)

Title: Outils de recherche et de fouille réexploitant les données patients à des fins de recherche biomédicales

Abstract: L’informatisation massive des données de santé offre des possibilité de ré-exploitation sans précédent au service de la recherche. La présentation aura pour objectif de montrer 3 types d’approches pour cette réexploitation : Au sein d’un entrepôt de données biomédical du CHU de Rennes pour la détection de cohortes d’intêret (Projet ROOGLE); A l’échelle nationale au travers de l’exploitation des données du SNIR-AM pour la pharmaco vigilance (Projet CIPIVI); Au niveau Européen au travers d’une fédération internationales pour les essais thérapeutique (Projet EHR4CR)

Joël Colloc (PU, docteur en médecine CIRTAI – Univ. du Havre)

Title: Aspects éthiques et impact social de l’utilisation du Big Data en santé

Abstract: L’utilisation massive des nouvelles technologies et des réseaux sociaux rend très difficile de garder ses problèmes de santé confidentiels ou du moins dans la sphère familiale. L’utilisation de données médicales à l’insu des patients a un impact social considérable. Obtenir un prêt, un emploi stable lorsque l’on a un cancer, une maladie cardiovasculaire, le Sida… devient impossible. On assiste à une exclusion de la société par le profilage des personnes. Le problème a plusieurs dimensions:

-Une dimension médico-légale : le secret médical existe-t-il toujours ? Quelle responsabilité dans l’utilisation de ces données ?
-Une dimension éthique : décider au cas par cas de ce qui est confidentiel ou pas.
-Une dimension épistémologique et sociale : le Big Data n’est-il pas l’ouverture vers le Big Brother et l’anéantissement de l’individu par sa dilution dans la société ?
Des moyens informatiques de protection des données confidentielles et du respect de la vie privée doivent être développés, ainsi qu’une meilleure information du public sur l’usage qui peut être fait de leurs données personnelles.
Le Big Data présente des intérêts épidémiologiques et de santé publique (détecter des conduites inadéquates, des problèmes de pharmacovigilance, des mauvaises pratiques dans des populations…). Où placer les frontières entre la sphère privée et le domaine public ?

Sihem Amer-Yahia (DR1 CNRS, LIG)

Title: Big (User) (Health) Data Management

Abstract: The Web has evolved from a technology platform to a social environment where factual, opinion and behavior data interleave. A large proportion of user-generated data on the Web contains personal health data and a number of applications that analyze and extract value from that data are being developed. I will describe an application for mining online health data and research directions foe exploiting that data. More specifically, I’ll talk about the preparation and exploration of big user health data found on the Web.

Biographie: Docteur en Informatique de l’Université Paris-Sud et de l’INRIA, Sihem Amer-Yahia est spécialiste de la gestion des informations dans les réseaux sociaux. Elle a commencé sa carrière à New -York au sein de la compagnie américaine AT&T avant de rejoindre le Yahoo! Labs en 2006 en tant que chercheuse senior. Elle étudie alors de nouvelles manières de connecter les énormes quantités de données produites par les utilisateurs et d’en extraire de la valeur. Après un passage à l’institut de recherche en informatique du Qatar (QCRI) en 2011, où elle met au point, à travers une collaboration avec des chercheurs du MIT, de nouveaux outils d’analyse pour aider les journalistes à mieux connaître leur public, elle intègre le CNRS en tant que Directrice de Recherche au Laboratoire d’Informatique de Grenoble en décembre 2011.

Comité d’organisation
______________________________

Hanene Azzag (LIPN, Univ. Paris 13)
Régis Beuscart (Univ. Lille 2)
Fatma Bouali (Univ. Lille 2)
Lydia Boudjeloud (LITA, Univ. de Lorraine)
Cécile Favre (ERIC, Univ. Lyon 2)
Jocelyne Fayn (INSERM)
Cyril de Runz (CReSTIC, Univ. Reims)
Germain Forestier (MIPS, Univ. de Haute Alsace)
Camille Kurtz (LIPADE, Paris Descartes)
Mustapha Lebbah (LIPN, Univ. Paris 13)
Fabien Picarougne (LINA, Univ. Nantes)
Bruno Pinaud (LABRI, Univ. Bordeaux)