Pondération d'attributs

Aller à : navigation, rechercher

Dans ce deuxième axe, nous avons proposé un mécanisme d'« adaptation » des données de l'utilisateur aux méthodes de classification. Pour cela, nous avons défini et implanté plusieurs méthodes évolutives de pondération automatique d'attributs pour la classification non supervisée. L'objectif est ici d'autoriser l'utilisateur à traiter toutes ses données de façon optimale par rapport aux méthodes de classification dont il dispose. Nous avons ainsi étudié et défini une famille de méthodes de classification non supervisée avec pondération d'attributs basées sur KMEANS par une approche évolutive. Différentes stratégies de recherche ont été étudiées : évolution classique et coévolution coopérative, modèles d'évolution darwinien, lamarckien ou baldwinien.

Pour nous affranchir de la nécessité d'avoir une mesure de distance, nous avons ensuite étudié et défini la méthode MACLAW (Modular Approach for Clustering with Local Attribute Weighting) pour la classification non supervisée avec pondération locale d'attributs par approche enveloppe. Contrairement aux approches co-évolutives précédentes à la KMEANS où les chromosomes des individus (un par population) sont fusionnés en un « chromosome global » utilisé pour construire la solution globale, l'approche dans MACLAW est différente. Elle consiste à construire localement un cluster par individu, la solution globale est alors construite par union de ces clusters (un par population) : ces clusters peuvent être définis à partir d'algorithmes de classification différents rejoignant ainsi l'approche multi-stratégies définie précédemment. Des tests réalisés sur différents ensembles de données ont montré sa capacité à trouver des classes valides et à mettre en évidence les attributs pertinents. Nous avons pu voir que la méthode MACLAW est particulièrement efficace face des objets complexes présentant des attributs nombreux et corrélés entre eux. Enfin, nous avons montré que nos méthodes coévolutives et en particulier MACLAW pouvaient être utilisée dans le cadre plus général de l'extraction d'information à partir de données pour réduire la dimentionnalité des données.

Cet axe de recherche a été initié par Pierre Gançarski suite aux travaux de thèse de Cédric Wemmert. Il s'agissait d'étudier des solutions aux problèmes rencontrés lors de la validation de notre méthode collaborative dans la cadre de l'analyse d'images de télédétection aussi bien lors de différents projets européen ou ANR que lors de collaborations avec le Laboratoire Image et Ville (LIV1). L'idée d'utiliser une approche évolutive est née des travaux de Jerzy Korczak sur les algorithmes génétiques et en particulier de ceux du stage de DEA (co-encadré par Jerzy Korczak et Pierre Gançarski) et de la thèse d'Arnaux Quirin sur la découverte de règles de classification par approche évolutive (thèse dirigée par Jerzy Korczak).

Ce sujet a principalement été traité dans le cadre de la thèse de Alexandre Blansché (co-encadrée par Jerzy Korczak, Christiane Weber et Pierre Gançarski).

Ces travaux ont été validés et utilisés pour la classification de pixels et de régions issues d'images hyperspectrales dans le cadre du projet FODOMUST.