|
|
On Mon 03/19/12 at 10:00, K71, Buiding K, RdC DEPECKER Marine (LIMA (Laboratoire Information Modèles et Apprentissage) à l’institut CEA LIST)
Construction d'arbres d'ordonnancement binaire : la méthode TreeRank
Sumary:
Cette présentation porte sur la problématique de l'ordonnancement (ou scoring) de données étiquetées de façon binaire, à laquelle on se trouve confronté dans de nombreuses applications telles que le diagnostic médical, le calcul du risque de crédit, la recherche automatique de documents, etc.
Nous présenterons une méthode non-paramétrique pour l'apprentissage supervisé de règles de scoring qui permet de généraliser la notion d'arbre de décision au problème de l'ordonnancement. Nous détaillerons le principe de cette méthode, appelée TreeRank, qui consiste à scinder l'espace des observations de manière récursive et adaptative, et qui produit des fonctions de score constantes par morceaux, pouvant être représentées graphiquement par un arbre binaire orienté.
Cette présentation abordera les trois étapes principales de la procédure d'apprentissage : la scission, la sélection de modèle et la fusion de modèles, qui confèrent à TreeRank une grande flexibilité et une bonne robustesse, tout en limitant le phénomène de sur-apprentissage.
Nous terminerons en présentant des perspectives d'applications concrètes de cette approche.
Quelques références :
. S. Clémençon, M. Depecker et N. Vayatis, Adaptive Partitioning Schemes for Bipartite Ranking: How to Grow and Prune a Ranking Tree, Journal of Machine Learning, Volume: 83, Issue: 1, Pages: 31-69, 2010
. S. Clémençon, M. Depecker et N. Vayatis, AUC optimization and the two-sample problem, Proceedings of NIPS'09, 2009
. S. Clémençon, M. Depecker et N. Vayatis, Données avec label binaire : avancées récentes dans le domaine de l'apprentissage statistique d'ordonnancements, Actes de la conférence CAP'10, 2010.
|