Dawa Derksen a brillamment soutenu sa thèse le 02/12/19
Classification contextuelle de gros volumes de données d’imagerie satellitaire pour la production de cartes d’occupation des sols sur de grandes étendues
Le jury était composé des personnes suivantes :
M. Sébastien LEFÈVRE (Université de Bretagne Sud/IRISA, Rapporteur)
M. Gabriele MOSER (Université de Gênes, Rapporteur)
Mme. Florence TUPIN (Télécom Paris, Examinatrice)
M. Mathieu FAUVEL (INRA, Examinateur)
Mme. Silvia VALERO (Université Paul Sabatier, Examinateur)
M. Éric Ceschia (INRA, Examinateur)
M. Julien MICHEL (CNES, Membre invité)
M. Jordi Inglada (CNES/CESBIO, Directeur de thèse)
Résumé:
L’occupation des sols est définie comme la description de la nature et de l’usage anthropique de la surface de la Terre. Une connaissance fiable et à jour de celle-ci est d’un grand intérêt pour de nombreuses applications, par exemple, le développement urbain, le climat, ou pour la détection d’évènements catastrophiques (feux de forêt, inondations, etc.). Actuellement, la plupart des cartes d’occupation des sols sont produites à partir d’images satellitaires, par exemple, les séries temporelles multi-spectrales de Sentinel-2. Certains algorithmes de classification supervisée sont conçus pour étiqueter rapidement les éléments d’un jeu de données à partir d’un ensemble d’exemples connus au préalable.
Une des difficultés rencontrées est la différentiation de certaines classes qui dépendent plus du contexte du pixel que de son contenu. C’est le cas pour les classes urbaines, (urbain dense/urbain diffus), où la distinction ne se fait pas au niveau des primitives décrivant chaque pixel, mais de certaines propriétés dans son voisinage.L’objectif de la thèse est donc de concevoir et de comparer plusieurs méthodes de prise en compte du voisinage des pixels, pour améliorer la qualité des cartes d’occupation des sols.
La première partie de la thèse s’intéresse à la définition de ce voisinage (sa forme) peut varier du voisinage carré à l’objet, en passant par le superpixel, qui peut être vu comme un intermédiaire entre les deux.
Dans un deuxième temps, il s’est agi d’étudier la façon de décrire le contenu du voisinage afin d’en tirer une classification. Cela peut être à travers certains descripteurs du contexte, comme la texture ou la forme, ou en fournissant le contexte entier au classifieur, qui peut alors être conçu pour appréhender les éléments géométriques de l’image (par exemple, les réseaux de neurones convolutionnels, CNN).
Cette thèse présente une nouvelle méthode de prise en compte du contexte qui consiste à calculer une primitive particulière: l’histogramme des classes dans dans un voisinage. En partant d’une classification des pixels, on peut alors itérer plusieurs étapes de classification successives, qui recalculent les histogrammes à l’aide des classifications précédentes. Cette méthode est comparée à l’état de l’art, (les modèles CNN) deux jeux d’expériences très différents (Sentinel-2 et SPOT-7).