Le projet TANAGRA

TANAGRA est un logiciel gratuit de DATA MINING destiné à l'enseignement et à la recherche. Il implémente une série de méthodes de fouilles de données issues du domaine de la statistique exploratoire, de l'analyse de données, de l'apprentissage automatique et des bases de données.

TANAGRA est un projet ouvert au sens qu'il est possible à tout chercheur d'accéder au code et d'ajouter ses propres algorithmes pour peu qu'il respecte la licence de distribution du logiciel.

L'objectif principal du projet TANAGRA est d'offrir aux chercheurs et aux étudiants une plate-forme de Data Mining facile d'accès, respectant les standards des logiciels du domaine, notamment en matière d'interface et de mode de fonctionnement, et permettant de mener des études sur des données réelles et/ou synthétiques.

Le second objectif de TANAGRA est de proposer aux chercheurs une architecture leur permettant d'implémenter aisément les techniques qu'ils veulent étudier, de comparer les performances des algorithmes. TANAGRA se comporte plus comme une plate-forme d'expérimentation qui leur permettrait d'aller à l'essentiel en leur épargnant toute la partie ingrate de la programmation de ce type d'outil : la gestion des données.

Le troisième et dernier objectif, en destination des apprentis programmeurs, vise à diffuser une méthodologie possible d'élaboration de ce type de logiciel. L'accès au code leur permettra de voir comment se construit ce type de logiciel, quels sont les écueils à éviter, quelles sont les principales étapes d'un tel projet, et quels sont les outils et les bibliothèques qu'il faut préparer pour le mener à bien. En ce sens, TANAGRA est plus un outil d'apprentissage des techniques de programmation.

TANAGRA n'intègre pas en revanche, à l'heure actuelle, tout ce qui fait la puissance des outils commerciaux du marché : multiplicité des sources de données, accès direct aux entrepôts de données et autres datamarts, appréhension des données à problèmes (valeurs manquantes...), interactivité des traitements, etc...

Précisions sur la licence de TANAGRA (voir le détail de la licence lors de l'installation). Le logiciel TANAGRA est développé à titre personnel par Ricco Rakotomalala. Il en a la propriété exclusive. Un logiciel est une oeuvre de l'esprit au sens du code de la propriété intellectuelle (Article L.112-2), exactement comme les ouvrages. Je (Ricco Rakotomalala) m'engage à rendre la version complète de TANAGRA indéfiniment gratuite sans aucune restriction. Il n'y aura jamais une organisation lucrative autour du développement et de la diffusion de TANAGRA. Le code source sera toujours librement accessible en ligne. Si une entité quelconque introduit des contraintes quant à l'accès au logiciel (ex. nécessité de s'enregistrer pour télécharger ; versions volontairement bridées avec des promesses de fonctionnalités étendues sur une variante améliorée payante ; code source non publié ; incorporation dans un package commercial ; ou que sais-je encore...), vous Ítes face à une distribution illicite.

L'utilisation du logiciel est totalement libre, dans quelque contexte que ce soit, y compris dans le cadre d'une activité commerciale. Si vous souhaitez citer TANAGRA dans vos travaux de recherche, voici la référence à utiliser : Ricco Rakotomalala, "TANAGRA : un logiciel gratuit pour l'enseignement et la recherche", in Actes de EGC'2005, RNTI-E-3, vol. 2, pp.697-702, 2005.

Une description approfondie du logiciel (version longue de l'article ci-dessus) est également disponible dans le numéro 32 de la revue MODULAD (Janvier 2005).

Ricco RAKOTOMALALA
Lyon - FRANCE
Janvier 2004.


Dernière modification : 08 septembre 2010.