Publications of Jérôme Darmont
Reference (inproceedings)
I. Nogueira, M. Romdhane, J. Darmont, "Modélisation des métadonnées d'un data lake en data vault", 18e conférence sur l'Extraction et la Gestion des Connaissances (EGC 2018), Paris, Janvier 2018; Revue des Nouvelles Technologies de l'Information, Vol. E-34, 257-262.
Abstract
Avec l'avènement des mégadonnées (big data), l'informatique décisionnelle a dû trouver des solutions pour gérer des volumes et une variété de données plus grands encore que dans les entrepôts de données, qui se sont révélés mal adaptés. Les lacs de données (data lakes) répondent à ces besoins du point du vue du stockage, mais nécessitent la gestion de métadonnées adéquates pour garantir un accès efficace aux données. Sur la base d'un modèle multidimensionnel de métadonnées conçu pour un lac de données patrimoniales présentant un défaut d'évolutivité de schéma, nous proposons dans cet article l'utilisation de la modélisation ensembliste, et plus particulièrement d'un data vault, pour traiter ce problème. Pour montrer la faisabilité de cette approche, nous instancions notre modèle conceptuel de métadonnées en modèles logiques et physiques relationnel et orienté document, respectivement. Nous comparons également les modèles physiques en termes de stockage et de temps de réponse aux requêtes sur les métadonnées.
Keywords
Mégadonnées, Big data, Lac de données, Data lake, Métadonnées, Modélisation ensembliste, Ensemble modeling, Data vault
[ BibTeX | XML | Full paper | Back ]