Connaissances et classification multistratégie d'objets complexes multisources

Aller à : navigation, rechercher

THESE de l'Université Louis Pasteur de Strasbourg.

Thèse soutenue le 29 Septembre 2010

Doctorant : Germain Forestier

Laboratoire d’accueil :

  • LSIIT (UMR 7005-CNRS), Université Louis Pasteur, Strasbourg.

Directeur de thèse :

Co-encadrant :

Problématique

Dans de nombreux domaines, la quantité et la complexité des données disponibles ont fortement augmenté. Résumer de telles données pour rendre plus efficaces les logiciels les manipulant et extraire des connaissances à partir de celles-ci nécessitent le développement de nouvelles approches. Dans ce cadre, la classification non supervisée apparaît comme un moyen efficace.

Ainsi, au sein de l'équipe FDBT de nombreuses méthodes ont été proposées ou sont en cours d'étude. Parmi ces dernières, l'approche multistratégie pour une classification non supervisée proposée et développée par Pierre Gançarski et Cédric Wemmert [1] a montré sa pertinence dans de nombreux domaines et en particulier pour la classification d'images de télédétection. Ces travaux ont mis en évidence des problèmes généraux liés à la classification d'objets complexes telles que la nécessité de traiter simultanément diverses sources d'information de même nature (images à diverses résolutions, ...) ou non (texte, annotation, ...) ou la prise en compte de connaissances du domaine.

Dans cette thèse, nous étudierons principalement l'intégration de ces deux aspects dans la méthode multistratégie pour la classification d'objets complexes de toute nature. Ainsi, nous nous proposons de prendre en compte les connaissances du domaine lors du processus de collaboration entre les différentes méthodes affectées aux différentes sources.

Les solutions proposées seront les plus générales possible et non spécialisées à un domaine particulier. Néanmoins, dans le cadre de collaborations renforcées avec le laboratoire Image et Ville (UMR 7011 CNRS/ULP), des expérimentations plus approfondies seront faites dans le domaine de l'extraction de connaissances à partir d'images de télédétection.

Etat initial

Cette thèse fait suite à plusieurs travaux réalisés au sein de notre équipe de recherche. On peut citer la thèse de Cédric Wemmert (2000) sur la classification hybride distribuée, la thèse de Sébastien Derivaux (en cours) sur la construction et la classification d'objets par une approche itérative guidée par des connaissances du domaine ou encore les stages de post-doctorat de David Sheeren (2005) [2] et Nicolas Durand (2006) [3] sur la construction et la définition de mécanismes d'interrogation d'une ontologie représentant les connaissances du domaine géographique urbain.

Lors du stage de Master Recherche de Germain Forestier, une première réflexion sur la classification collaborative et l'intégration de connaissances a été initiée. Au cours de ce stage, une nouvelle méthode collaborative en classification orientée objets intégrant des connaissances de haut niveau sous forme d'une ontologie a été proposée [4,5].

Plan de travail

La première étape de cette thèse consistera en la validation par des tests plus approfondis de l'approche proposée lors de du stage de Master Recherche de Germain Forestier à la fois dans le domaine de la classification d'images de télédétection, mais aussi sur des bases de données de référence afin de pouvoir la comparer avec les approches existantes.

Ensuite il faudra s'intéresser à l'aspect classification multisource. L'idée est de proposer une méthode de classification non supervisée capable d'utiliser diverses sources de données et de profiter de la complémentarité des données durant l'apprentissage. Une validation sur des images de télédétection à différentes résolutions et à différentes dates sera réalisée.

Finalement, on s'intéressera à l'intégration des connaissances du domaine dans un processus de classification non supervisée. Les diverses méthodes de représentation de connaissances et leur utilisation seront étudiées. Enfin une méthode générale de clustering multisource guidée par des connaissances du domaine sera proposée. La validation de l'approche se fera dans le domaine de la construction automatique de cartes thématiques à partir d'images de télédétection et de la segmentation et labellisation automatique d'images.


[1] P. Gancarski, C. Wemmert, Collaborative Multi-step Mono-level Multi-strategy Classification, Journal on Multimedia Tools and Applications, Vol. 35, Num. 1, Springer Ed., pp 1--27 - october 2007

[2] D. Sheeren, A. Quirin, A. Puissant, P. Gancarski, C. Weber, Discovering Rules with Genetic Algorithm to Classify Remotely Sensed Data, IEEE Int. Geosciences and Remote Sensing Symposium, pp 3919--3922, Denver, Colorado - july 2006

[3] S. Derivaux, N. Durand, C. Wemmert, On the Complementarity of an Ontology and a Nearest Neighbour for Remotely Sensed Image Interpretation, IEEE Int. Geosciences and Remote Sensing Symposium, 2007

[4] Forestier G., Wemmert C. and Gancarski P., Collaborative multi-strategical classification for object-oriented image analysis, Workshop on Supervised and Unsupervised Ensemble Methods and Their Applications in conjunction with IbPRIA, pp 80--90, Girona, Spain - june 2007

[5] Durand N., Derivaux S., Forestier G., Wemmert C., Gancarski P., Boussaid O., Puissant A. Ontology-based Object Recognition for Remote Sensing Image Interpretation. IEEE Int. Conf. on Tools with Artificial Intelligence 2007, Patras - Greece, November 2007.