Publications of the ERIC lab
AIGLE

(92) Production(s) of DARMONT J.

|
|
Materialized View Selection by Query Clustering in XML Data Warehouses 
Author(s): MAHBOUBI H., Aouiche Kamel, DARMONT J.
Proceedings: Conference: 4th International Multiconference on Computer Science and Information Technology (CSIT 06) (Amman, JO, 2006)
Published: Proceedings of the 4th International Multiconference on Computer Science and Information Technology (CSIT 06), vol. (2006) p.68-77
Ref HAL: hal-00320632_v1
Ref Arxiv: 0809.1963
Abstract: XML data warehouses form an interesting basis for decision-support applications that exploit complex data. However, native XML database management systems currently bear limited performances and it is necessary to design strategies to optimize them. In this paper, we propose an automatic strategy for the selection of XML materialized views that exploits a data mining technique, more precisely the clustering of the query workload. To validate our strategy, we implemented an XML warehouse modeled along the XCube specifications. We executed a workload of XQuery decision-support queries on this warehouse, with and without using our strategy. Our experimental results demonstrate its efficiency, even when queries are complex.
|

|
|
Un index de jointure pour les entrepôts de données XML 
Author(s): MAHBOUBI H., Aouiche Kamel, DARMONT J.
Proceedings: Conference: 6èmes Journées Francophones Extraction et Gestion des Connaissances (EGC 06) (Lille, FR, 2006)
Published: Actes des 6èmes Journées Francophones Extraction et Gestion des Connaissances (EGC 06), vol. E-6 (2006) p.89-94
Ref HAL: hal-00321114_v1
Abstract: Les entrepôts de données XML proposent une base intéressante pour les applications décisionnelles qui exploitent des données hétérogènes et provenant de sources multiples. Cependant, les performances des SGBD natifs XML étant actuellement limitées, il est nécessaire de trouver des moyens de les optimiser. Dans cet article, nous proposons un nouvel index spécifiquement adapté à l'architecture multidimensionnelle des entrepôts de données XML, qui élimine le coût des jointures tout en préservant l'information contenue dans l'entrepôt initial. Une étude théorique et des résultats expérimentaux démontrent l'efficacité de notre index, même lorsque les requêtes sont complexes.
|

|
|
A COMPLEX DATA WAREHOUSE FOR PERSONALIZED, ANTICIPATIVE MEDICINE 
Author(s): DARMONT J., Olivier Emerson
Proceedings: Conference: 17th Information Resources Management Association International Conference (IRMA 06) (Wahsington, DC, US, 2006)
Published: Proceedings of the 17th Information Resources Management Association International Conference (IRMA 06), vol. (2006) p.685-687
Ref HAL: hal-00321989_v1
Ref Arxiv: 0809.2688
Abstract: With the growing use of new technologies, healthcare is nowadays undergoing significant changes. Information-based medicine has to exploit medical decision-support systems and requires the analysis of various, heterogeneous data, such as patient records, medical images, biological analysis results, etc. In this paper, we present the design of the complex data warehouse relating to high-level athletes. It is original in two ways. First, it is aimed at storing complex medical data. Second, it is designed to allow innovative and quite different kinds of analyses to support: (1) personalized and anticipative medicine (in opposition to curative medicine) for well-identified patients; (2) broad-band statistical studies over a given population of patients. Furthermore, the system includes data relating to several medical fields. It is also designed to be evolutionary to take into account future advances in medical research.
|

|
|
Clustering-Based Materialized View Selection in Data Warehouses 
Author(s): Aouiche Kamel, Jouve Pierre, DARMONT J.
Proceedings: Conference: 10th East-European Conference on Advances in Databases and Information Systems (ADBIS 06) (Thessaloniki, GR, 2006)
Published: LNCS, vol. 4152 (2006) p.81-95
Ref HAL: hal-00320624_v1
Ref Arxiv: cs/0703114
Abstract: The materialized view selection is a non-trivial task. Hence, its complexity must be reduced. A judicious choice of views must be cost-driven and influenced by the workload experienced by the system. In this paper, we propose a framework for materialized view selection that exploits a data mining technique (clustering), in order to determine clusters of similar queries. We also propose a view merging process that builds a set of candidate views, as well as a greedy process for selecting a set of views to materialize. This selection is based on cost models that evaluate the cost of accessing data using views and the cost of storing these views. To validate our strategy, we executed a workload of decision-support queries on a test data warehouse, with and without using our strategy. Our experimental results demonstrate its efficiency, even when storage space is limited.
|

|
|
Evaluating the Performance of Dynamic Database Applications 
Author(s): He Zhen, DARMONT J.
Book chapter: Advanced Topics in Database Research, vol. (2006) p.294-319
Ref HAL: hal-00608525_v1
DOI: 10.4018/978-1-59140-935-9.ch016
Abstract: This chapter explores the effect that changing access patterns has on the performance of database management systems. Changes in access patterns play an important role in determining the efficiency of key performance optimization techniques, such as dynamic clustering, prefetching, and buffer replacement. However, all existing benchmarks or evaluation frameworks produce static access patterns in which objects are always accessed in the same order repeatedly. Hence, we have proposed the dynamic evaluation framework (DEF) that simulates access pattern changes using configurable styles of change. DEF has been designed to be open and fully extensible (e.g., new access pattern change models can also be added easily). In this chapter, we instantiate DEF into the dynamic object evaluation framework (DoEF), which is designed for object databases, that is, object-oriented or object-relational databases such as multimedia databases or most eXtensible Mark-up Language (XML) databases
Comments: atdr05hd
|

|
|
Managing and Processing Complex Data for Decision Support 
Author(s): DARMONT J., BOUSSAID O.
Book:
Idea Group Publishing (2006) 433p.
DOI: 10.4018/978-1-59140-655-6
Abstract: In many decision support fields the data that is exploited tends to be more and more complex. To take this phenomenon into account, classical architectures of data warehouses or data mining algorithms must be completely re-evaluated.
Processing and Managing Complex Data for Decision Support provides readers with an overview of the emerging field of complex data processing by bringing together various research studies and surveys in different subfields, and by highlighting the similarities between the different data, issues, and approaches. This book deals with important topics such as: complex data warehousing, including spatial, XML, and text warehousing; and complex data mining, including distance metrics and similarity measures, pattern management, multimedia, and gene sequence mining.
Comments: IGI05db
|

|
|
Optimisation et évaluation de performance pour l'aide à la conception et à l'administration des entrepôts de données complexes 
Author(s): DARMONT J.
(H.D.R.)
, 2006-11-23
Ref HAL: tel-00143361_v1
Abstract: Les entrepôts de données forment le socle des systèmes décisionnels. Ils permettent d'intégrer les données de production d'une entreprise ou d'un organisme et sont le support de l'analyse multidimensionnelle en ligne (OLAP) ou de la fouille de données. Avec l'exploitation de plus en plus courante de données complexes dans le cadre des processus décisionnels, de nouvelles approches d'entreposage, qui exploitent notamment le langage XML, sont développées. Dans ce contexte, le problème de la performance des entrepôts de données demeure plus que jamais un enjeu crucial. Le travail présenté dans ce mémoire vise à proposer des solutions innovantes au niveau de l'optimisation et de l'évaluation des performances des entrepôts de données. Nous avons en effet conçu une approche générique dont l'objectif est de proposer automatiquement à l'administrateur d'un entrepôt des solutions permettant d'optimiser les temps d'accès aux données. Le principe de cette approche est d'appliquer des techniques de fouille de données sur une charge (ensemble de requêtes) représentative de l'utilisation de l'entrepôt de données afin de déduire une configuration quasi-optimale d'index et/ou de vues matérialisées. Des modèles de coût permettent ensuite de sélectionner parmi ces structures de données les plus efficaces en terme de rapport gain de performance/surcharge. Par ailleurs, l'évaluation de performance peut venir en appui de la conception des entrepôts de données. Ainsi, afin de valider notre approche de manière expérimentale, nous avons également conçu plusieurs bancs d'essais génériques. Le principe directeur qui a présidé à leur élaboration est l'adaptabilité. En effet, pour comparer l'efficacité de différentes techniques d'optimisation des performances, il est nécessaire de les tester dans différents environnements, sur différentes configurations de bases de données et de charges, etc. La possibilité d'évaluer l'impact de différents choix d'architecture est aussi une aide appréciable dans la conception des entrepôts de données. Nos bancs d'essais permettent donc de générer diverses configurations d'entrepôts de données, ainsi que des charges décisionnelles qui s'y appliquent. Finalement, nos solutions d'optimisation et d'évaluation des performances ont été mises en oeuvre dans les contextes des entrepôts de données relationnels et XML.
---------
|