Back RSS stream

Publications of Jérôme Darmont

Reference (misc)

K. Aouiche, J. Darmont, L. Gruenwald, "Extraction de motifs fréquents pour l'auto-administration des bases de données", Journées francophones d'Extraction et de Gestion des Connaissances (EGC 03), Lyon; Revue des Sciences et Technologies de l'Information, Vol. 17, 547, Janvier 2003 (poster).

Abstract

Avec le développement des bases de données en général et des entrepôts de données (data warehouses) en particulier, il est devenu très important de réduire la fonction d'administration de base de données. Les systèmes auto-administratifs ont pour objectif de s'administrer et de s'adapter eux-mêmes, automatiquement, sans perte (ou même avec un gain) de performance. L'idée d'utiliser des techniques de fouille de données (data mining) pour extraire des connaissances utiles pour leur administration à partir des données stockées est avancée depuis quelques années. Pourtant, aucune recherche n'a été entreprise dans ce domaine à notre connaissance. Cela reste néanmoins une approche très prometteuse, notamment dans le domaine des entrepôts de données, où les requêtes sont très hétérogènes et ne peuvent pas être interprétées facilement. L'objectif de ce travail est de rechercher une façon d'extraire des données elles-mêmes des connaissances utilisables pour appliquer de manière automatique des techniques d'optimisation des performances, et plus particulièrement d'indexation. Nous avons réalisé un outil qui effectue une recherche de motifs fréquents sur une charge donnée pour calculer une configuration d’index permettant d’optimiser le temps d’accès aux données. Les expérimentations que nous avons menées ont montré que les configurations d’index générées par notre outil permettent des gains de performance de l’ordre de 15 à 25 % sur une base et un entrepôt de données tests.

Keywords

Bases de données, Entrepôts de données, Indexation automatique, Fouille de données, Motifs fréquents

 

[ BibTeX | XML | Full paper | Back ]