Projets

Aller à : navigation, rechercher

Depuis 2016, l'équipe BFO a été scindée en 2 nouvelles équipes :

Projets de l'ancienne équipe BFO

Projet R&D TSA (Juin 2013 - Mai 2015) 
Le projet cherche à optimiser les trajets réalisés par une flotte de véhicules dans un territoire, en fonction d'un nombre important de contraintes (l'état du trafic, le type de véhicule, des contraintes "sociales" ou "syndicales", etc.). Dans ce contexte, la structuration des données nécessaires pour représenter correctement une situation et prendre en compte les contraintes dans une optique d'optimisation multicritère devient essentielle. Nous proposons d'utiliser les techniques d’ingénierie des connaissances, et en particulier la création d'une ontologie du domaine pour formaliser le modèle de la base de connaissances. Dans le but d'améliorer la performance de l'algorithme génétique, nous nous intéressons aussi à la formalisation des connaissances décisionnelles pour guider les solutions à ces problèmes concrets d'optimisation, en capitalisant les connaissances déjà acquises lors de l'utilisation préalable de l'algorithme d'optimisation développé et des "résultats" obtenus. Ce projet est le résultat d'une collaboration entre les thèmes Optimisation Stochastique et Ingénierie des Connaissances, avec la startup strasbourgeoise Synovo.
ANIMITEX - Projet MASTONDONS 2013-2016 
La mise à disposition des données satellites à haute et très haute résolution avec une forte répétitivité temporelle pose le problème d'une analyse efficace et rapide de la multitude d'informations qu'elles contiennent. Celle-ci demande un investissement humain conséquent et nécessite de recourir à des méthodes complémentaires de celles de télédétection pour répondre aux enjeux sociétaux associés. Le projet ANIMITEX, ambitieux et exploratoire, s'inscrit dans ce contexte et a pour ambition d'exploiter des données textuelles massives et hétérogènes afin d'apporter des informations cruciales permettant de compléter l'analyse des images satellites. Le consortium proposé repose sur des compétences fortes en fouille de texte et télédétection des laboratoires impliqués afin de mettre en place une synergie d'excellence permettant de répondre à la problématique posée.
CHIST-ERA - Projet Reframe (Repenser l'essence, la flexibilité et la réutilisabilité de l'exploitation de modèles avancés) (Octobre 2012 - Mars 2016)
Ce projet étudie la construction de modèles adaptables à divers changements de contextes entre leur construction et leur déploiement. Les membres du thème fouille de données participent à ce projet, ainsi que des membres du laboratoire de géographie (LIVE).
ANR - Programme MN - Projet Coclico (Collaboration, Classification, Incrémentalité et Connaissances) (Novembre 2012 - Octobre 2016)
COCLICO est un projet de recherche visant à étudier et proposer une méthode générique innovante permettant une analyse multi-­‐‐échelle de grands volumes de données spatiotemporelles fournies en continue de qualité très variable, mettant en œuvre une approche multistratégie incrémentale dans laquelle la collaboration entre les différentes méthodes de fouille de données sera guidée par des connaissances du domaine thématique (Géosciences, Géographie, Géomatique et Télédétection) formalisées en ontologies et du domaine de l’analyse (connaissances sur les méthodes), et garantissant un objectif de qualité finale prenant en compte la qualité des données et celles des connaissances.
Le consortium de ce projet regroupe un ensemble d'experts en apprentissage, en qualité des données, structuration et extraction de connaissances à partir de données (LSIIT, LIPN, AgroParis Tech et Espace-Dev), et d'experts en biodiversité et en géographie (Espace-Dev, LIVE).
ANR - Programme MN - Projet Fresqueau (Fouille de données pour l'évaluation et le suivi de la qualité hydrobiologique des cours d'eau) (Octobre 2011 - Décembre 2014)
L'objectif de ce projet est de contribuer au développement d'outils opérationnels pour évaluer la qualité des masses d'eau, et notamment, comparer et utiliser l'ensemble de tous les paramètres disponibles qui pourront traduire l'état des cours d'eau ainsi que l'ensemble des informations permettant de décrire les usages et les mesures prises.
Ces données se caractérisent par une grande hétérogénéité et une grande complexité, avec des problèmes de qualité de données (données incomplètes, incertaines), de mise en forme et de structuration (différentes sources et points de vue), de granularité temporelle et spatiale. Concernant les méthodes, il s'agit principalement de mettre au point des méthodes permettant la découverte de relations spatiales et temporelles, et de méthodes permettant une synthèse non simplificatrice d'informations complexes et hétérogènes et leur mise en relation avec une expertise.
La plateforme finale inclura un entrepôt de données, ainsi qu'une typologie de stations, et un ensemble de méthodes d'analyse et de fouille de données. La typologie sera un moyen pour guider l'analyse et l'interprétation des relevés d'une station, en lien avec les pressions constatées, dans le but d'évaluer la qualité globale d'une masse d'eau.
Le consortium de ce projet regroupe un ensemble d'experts en structuration et extraction de connaissances à partir de données (LHYGES, TETIS, LSIIT et LIRMM), et d'experts en hydroécologie (LHYGES, TETIS, AQUASCOP et AQUABIO).
Thèse CNES/Région Alsace - Extraction et analyse relations spatiales entre objets d'intérêt dans les images de télédétection guidées par des connaissances du domaine (2011/2014)
L'environnement proposé dans le cadre de cette étude (dirigée par Cédric Wemmert) devra permettre une utilisation conjointe d'un ensemble de données multisources, hétérogènes et complexes (optique, photo, altitude, multi-résolution). L'objectif est de parvenir à extraire, modéliser et utiliser des informations sur des relations spatiales entre objets d'intérêt pour guider le processus d'extraction d'information et de classification d'images à partir de cet ensemble de données.


Projets plus anciens

  • Projet DAHLIA (Sept. 2010 - Sept. 2013)
Ce projet, soutenu par la Région Alsace porte sur le maintien à domicile des personnes agées. Il regroupe plusieurs sociétés ainsi que des membres de l'équipe RP et de l'équipe MIV. L'équipe BFO (Pierre Gançarski et Nicolas Lachiche) travaille (en collaboration avec Christophe Collet de l'équipe MIV) plus précisément sur la modélisation des comportements des personnes âgées dans le but de détection de comportements anormaux nécessitant une aide d'urgence en utilisant de l'information provenant des capteurs est incomplète, laquelle peut être empreinte d'incertitude, d'imprécision et de flou. L'équipe RP travaille sur les aspects capteur (de position, vidéo, sonore, etc.). Dans ce projet deux thèses : chacune sur un de ces deux aspects.
  • ANR - Programme COSINUS - Projet FOSTER (FOuille de données Spatio-Temporelles, application à la compréhension et à la surveillance de l'ERosion) (Janvier 2011 - Mars 2013) : L'exploitation de ces masses de données spatiotemporelles générées par les sciences de l'environnement pose donc un grand nombre de problèmes. Dans ce contexte, ce projet a pour objectif de concevoir, développer et mettre en oeuvre des nouveaux processus d’analyse adaptés aux masses de données spatio-temporelles dans l’optique d’une gestion améliorée de l’environnement. Deux tâches critiques de ce processus seront plus particulièrement étudiées : la segmentation des images satellitaires basée sur des méthodes collaboratives, et la construction de modèles descriptifs (motifs, « clustering », …) et/ou prédictifs (arbres de décision,…) intégrant de l'information spatio-temporelle. Ce projet visera ainsi à apporter de nouveaux moyens (méthodes, algorithmes, logiciels) d’exploitation des masses de données spatio-temporelles générées par les sciences environnementales, avec plus particulièrement la volonté d’assister la découverte de connaissances de la part des experts « propriétaires » de telles données. Ce projet regroupe (1) des informaticiens des laboratoires LIRIS, LISTIC, LSIIT et PPME avec des expertises complémentaires dans les domaines de la fouille de données et de l'imagerie; (2) des géologues, géographes et géophysiciens des laboratoires PPME et IPGS experts dans la caractérisation et la quantification des phénomènes érosifs et des processus de glissements de terrain; (3) la société Bluecham dont le coeur de métier est d’opérer des systèmes d’aide à la décision en environnement intertropical.
  • Laboratoire Roche (Sept. 2010 - Sept. 2012): Ce projet porte sur l'analyse d'images correspondantes à des coupes de tissus dans le but d'extraire des informations sur l'efficacité (ou non) de molécules médicamenteuses.


  • Société Atlante (2010) : Etude prospective sur l'imagerie thermique (confidentielle)
  • CNES (Centre National d'Etudes Spatiales)
    • Etude ORFEO GT3 (2011-2012) : Modélisation des objets d'intérêt dans les images de télédétection et de leurs relations spatiales pour une extraction guidée par ces connaissances (Stage M2R)
    • Bourse cofinancée avec Thalès (2009-2012) : Classification non supervisée de séries temporelles d'images satellites hétérogènes
  • PROJET TRANSVERSAL ENTRE LES 2 THEMATIQUES DE BFO : ETUDE DES INTRONS

    L'équipe FDBT a l'avantage de réunir simultanément des experts en bioinformatique théorique, en fouille de données et en évolution artificielle. Un projet commun et fédérateur consistera à travailler autour des introns dont l'origine évolutive et la fonctionnalité dans les gènes des eucaryotes restent mystérieuses et à préciser. La structure nucléotidique des introns diffère radicalement de celle des gènes, en particulier elle présente une périodicité modulo 2 (Michel, Journal of Theoretical Biology 120, 1986; Arquès et Michel, Nucleic Acids Research 15, 1987; etc.). Nous nous proposons de caractériser cette périodicité par différentes approches: programmation génétique, méthode d'entropie, algorithmes de compression, analyse multifractale. A quels motifs est-elle associée: alphabet {A,C,G,T} ou {R,Y}, longueur et structure des motifs associés, nombre et type de mutations sur ces motifs, comparaison avec la structure des gènes, etc.
  • ANR Jeune Chercheur Ecosgil
    co-coordinateurs : Anne Puissant (MCF en Géographie, LIV Strasbourg) et Cédric Wemmert .
  • Contrat R&D CNES/LSIIT-FDBT
    Une offre d'étude a été validée par le comité de pilotage de la R\&D du CNES (Centre National d'Etude Spatiale). Cette étude a démarrée en octobre 2007. Elle est financée par le CNES. Par ce projet, dirigé par Pierre Gançarski et Cédric Wemmert en collaboration avec Anne Puissant, il s'agit de fournir un système interactif d'aide à l'interprétation d'images satellite. De plus, une méthode générique permettant l'utilisation conjointe d'images de différents types et différentes résolutions devra être développée et testée. Les expérimentations se focaliseront sur des données SPOT (haute résolution) et type Pléiades (très haute résolution). Ce contrat devrait permettre l'embauche au sein du LSIIT-FDBT d'un post-doctorant pendant 6 mois ainsi que d'un ingénieur de développement pendant 3 mois.
  • ANR - Programme blanc
    Le projet GeOpenSim proposé en réponse à l'appel à projet blanc ANR 2007 par Anne Ruas (IGN - Paris), Christiane Weber (LIV - Strasbourg) et Pierre Gançarski a été retenu et financé.
    L'objectif de ce projet de recherche est de concevoir une nouvelle plate-forme OpenSource dédiée à l'analyse des tissus urbains qui disposerait des caractéristiques suivantes : (1) une représentation vectorielle et multi-niveaux de l'information géographique apte à décrire les tissus urbains, (2) des mécanismes permettant de simuler des évolutions du tissu urbain en se basant sur une représentation d'agents géographiques vectoriels et sur des mécanismes de croissances et de dépendances fonctionnelles, (3) une bibliothèque composée d'algorithmes d'analyse et d'agrégation et d'algorithmes d'apprentissage permettant d'enrichir la description de l'espace.
  • METHODES INFORMATIQUES POUR L'IDENTIFICATION DE CODES CIRCULAIRES DANS LES GENES

    La recherche de codes circulaires et de motifs préférentiels dans les génomes se poursuit avec le développement de méthodes informatique et statistiques plus fines dont le principe général repose sur une idée très peu exploitée basée sur l'analyse simultanée des 3 phases des gènes.
  • RECHERCHE DE CONSEQUENCES DES CODES CIRCULAIRES DANS LES GENES

    Récemment, nous nous intéressons aux conséquences des codes circulaires dans les gènes (frameshift genes, etc.).
  • POURSUITE DES ETUDES THEORIQUES DES COMMA FREE CODES ET DES CODES CIRCULAIRES (avec Dr Giuseppe Pirillo, Florence)
  • GENERALISATION DES MODELES D'EVOLUTION CHAOTIQUE DES GENES (avec Prof. Jacques Bahi, Belfort)
  • ETUDE ANALYTIQUE DES DISTANCES PHYLOGENETIQUES ET LEURS APPLICATIONS A L'INFERENCE PHYLOGENETIQUE (avec Dr Alexis Criscuolo)
  • Projet européen - TIDE
    En 2002, nous avons intégré le projet européen TIDE (Tidal Inlets Dynamics and Environment). En collaboration avec les universités de Padoue, Trente et Venise (Italie) et de Saint-Andrews (GB) nous sommes intervenus plus particulièrement dans le Works Package 6. Vegetation and microphytobentos classification from remote sensing data. Dans ce cadre, nous avons pu compléter et appliquer notre approche multi-stratégies sur des images de grande taille (images hyperspectrales) fortement bruitées. Ce fort bruit nous a contraint à étudier l'intégration dans notre système d'un moyen de sélectionner les bandes à utiliser.
    Ainsi, nous avons été amenés à nous intéresser à des données complexes (images hyperspectrales, zones homogènes vectorisées) présentant un grand nombre d'attributs pouvant être redondants, fortement bruités voire inutiles. Nous avons développé différentes méthodes coévolutives permettant de classifier de tels objets en sélectionnant pour chaque classe d'objets les << meilleures >> caractéristiques sous forme d'une pondération locale des attributs lors de la mise en évidence de la classe.
    De fait, parallèlement, nous avons été amenés à étendre notre domaine de compétence de l'informatique pure à la géomatique.
    Nous sommes ainsi passés d'une vue strictement numérique des pixels et statistiques des résultats à une vue plus géographique dans laquelle les zones sont des régions thématiques (approche orientée objets) et les résultats sont pertinents (ou non) par rapport à la connaissance du domaine (expert humain, logiciels dédiés, ontologie, ...). De cette évolution est né le projet FoDoMuSt.
  • ACI Masse de Données FoDoMuSt (2004-2007)
    Le projet FoDoMuSt a été accepté dans le cadre de la campagne 2004 de l'ACI Masses de Données. Coordonné par Pierre Gançarski, il a regroupé une quinzaine de personnes (dont 10 permanents) issues de trois laboratoires de recherche français : le LSIIT, le LIV (Laboratoire Image et Ville, Strasbourg, coord. locale : Christiane Weber) et ERIC (Equipe de Recherche en Ingeniérie des Connaissances, Lyon, coord. local : Omar Boussaïd). Il a permis l'embauche de deux post-doctorants au sein de l'équipe AFD : David Sheeren (septembre 2005/août 2006) et Nicolas Durand (septembre 2005/mars 2006).
    Les objectifs de cette collaboration étaient de proposer une méthode d'aide à l'interprétation de l'information issue d'une masse de données images et de définir et préciser le processus d'extraction d'informations et de connaissances permettant l'utilisation conjointe et complémentaire de différentes sources d'informations voir site. Ce projet a donné lieu à près de 20 réunions entre 2004 et 2007, une présentation de 3 heures en séminaire avec invitation de membres externes au LSIIT, une trentaine de publications dont près d'un tiers en revue internationale.