Enormément de domaines de recherche sont confrontés un jour ou l'autre à ce même problème : mettre en évidence une structure, une représentation simplifiée et ordonnée du monde, là où règne le désordre et l'incompréhension. Par exemple, le biologiste voudra grouper différentes molécules en fonction de leurs effets sur différents gènes ; l'économiste aura à coeur de pouvoir distinguer les entreprises saines des entreprises en faillite ; identifier avec certitude les champs, les forêts sur une image satellitaire retiendra toute l'attention du géographe. Tous ces problèmes ont un point commun qui porte un nom : la classification.
Les problèmes de classification se divisent en deux parties : les problèmes de classification supervisée (encore appelés analyse discriminante) et les problèmes de classification non supervisée (encore appelés simplement classification ou clustering). L'analyse discriminante consiste à affecter une nouvelle observation à des groupes prédéfinis : elle recherche donc à expliquer une variable qualitative à partir d'informations contenues dans un ensemble de variables explicatives. La classification tente quant à elle de reconnaître des groupes (ou encore classes) parmi un ensemble d'observations, de sorte que deux entités dans une même classe soient plus proches que deux objets dans deux classes différentes.
L'unité de Statistique s'intéresse aussi bien aux problèmes d'analyse discriminante qu'aux problèmes de clustering. En partant sur la seule hypothèse que les observations sont distribuées suivant des processus de Poisson, divers algorithmes sont développés et étudiés : propriétés théoriques, coûts en place mémoire et temps d'exécution, convergence). Finalement, au travers les diverses collaborations que l'Unité de Statistiques entretient, ces nouvelles méthodes sont appliquées à différents problèmes : prédiction précoce de faillites d'entreprises, télédétection, reconnaissance de forme, ...
Les outils utilisés dans le développement de ces outils sont très variés : estimations non paramétriques de densité à l'aide des histogrammes, des noyaux, des ondelettes, arbres de discrimination, ...
D'autres recherches en cours s'attardent à étendre le domaine d'application de ces algorithmes à la classification de données symboliques et à la classification de séries chronologiques. Des méthodes permettant la détermination du nombre de classes sont également étudiées.
Structure et organisation interne
L'équipe de recherche est dirigée par J.-P. RASSON
Contact
Rue Rempart de la Vierge, 8,
5000
Namur
Tel: 081/724905
Fax:
081/724914
Mail:
