Monthly Archives: août 2013

Retour sur l’atelier SOLAP d’EDA 2013

Le Spatial OLAP (SOLAP) consiste dans l’analyse en ligne des données ayant une composante spatiale, composante présente dans de nombreuses données (entreprises, environnement, etc.).

L’atelier que nous avons organisé lors des journées EDA 2013 a mis globalement en évidence des problématiques liées à la modélisation et l’analyse décisionnelle de grandes quantités de données spatiales d’un point de vue de conceptuel et performance.

L’atelier a réuni 20 participants dont 3 organisateurs et a comporté 5 présentations. Chaque présentation a donné lieu à un exposé de 20 minutes suivies de 15 minutes de discussion.

Les travaux présentés portent tous sur les entrepôts de données spatiales et le Spatial OLAP.

Le premier intervenant, André Miralles (Irstea, Montpellier) a exposé les problématiques liées à la modélisation conceptuelle et l’implémentation des systèmes SOLAP dans le domaine environnemental en mettant l’accent sur une démarche Agile (itérative et incrémentale) de conception lorsque les données à analyser sont elles aussi les objets de recherche des experts thématiques (hydrologues) et donc des données et concepts qui évoluent tout le long du projet. Il nous a présenté le projet SIE (Acronyme) pesticide qui permet l’analyse SOLAP des polluants dans les bassins versants de France

Dino Lenco (Irstea, Montpellier) a présenté le projet Fresqeau qui a comme but entre autres l’analyse de l’état de qualité du réseau hydrographique de France avec des systèmes SOLAP. Il a montré les modèles conceptuels de 3 entrepôts de données pour l’analyse des taxons, des paramètres physico chimiques et leur qualité. En effet, il a mis en avance les problématiques liées à l’introduction de données de « mauvaise » qualité dans le système SOLAP.

Ibtismem Frihi (Université des Sciences et de la Technologie Houari Boumediene, Algérie) a présenté une vision globale des problèmes de performances particuliers issus des entrepôts de données spatiales et les techniques physiques d’optimisation : indexes, vues matérialisées et fragmentation. Elle a présenté les travaux existants sur les indexes et les vues matérialisées ainsi que quelques pistes de recherche. Globalement, cette présentation s’avère très intéressante car elle explore un domaine de recherche très nouveau.

Elodie Edoh-Alove (Irstea, Clermont Ferrand) a exposé les problématiques du SOLAP et le vague dans le spatial. Le vague spatial est une imperfection courante des données. De nombreux travaux proposent de nouveaux modèles pour gérer le vague spatial. Néanmoins, l’implémentation de ces modèles dans les cubes de données et leur utilisation avec des outils SOLAP sont encore à l’état embryonnaire. Aussi, elle a présenté une nouvelle approche pour concevoir des cubes de données spatiales prenant en compte la tolérance des utilisateurs aux risques de mauvais usages des cubes.

Thomas Devogele (LI, Université François Rabelais de Tours) a introduit les problématiques liées à l’analyse en ligne des trajetoires. De plus en plus de données issues de capteurs GPS ou d’autres sources permettent de suivre des objets mobiles et d’analyser les trajectoires. Ces analyses demandent de regrouper des trajectoires afin de déduire des patrons de déplacements spatio-temporels. Ces analyses demandent d’étudier les phénomènes selon différentes dimensions (temporelle, spatiale, types d’objets mobiles) et à différentes granularités. Une approche SOLAP semble donc adaptée. Néanmoins, il est nécessaire au préalable de résoudre différents verrous.
– Comment agréger des trajectoires ? La fonction d’agrégation de trajectoire doit être définie afin de représenter la trajectoire usuelle, mais aussi les écarts statistiques temporels et spatiaux.
– Comment définir les hiérarchies significatives. Par exemple, d’un point de vue temporel, « heure de pointe en semaine », « heure creuse en semaine », « départ en vacances » ont plus de sens comme périodicité que les jours ?
– De même les découpages spatiaux et temporels doivent pouvoir être déduits d’analyse statistique et non de découpages arbitraires.

S. Bimonte et O. Boucelma