Classification robuste par modèle de mélange
Les base de données terrain large échelle telles que le Registre Parcellaire Graphique ou CORINE Land Cover sont utilisées comme données de référence pour de nombreuses applications en télédétection. Par exemple, pour le produit du CES OSO, les algorithmes d’apprentissage utilisent une agrégation de ces base de données. Cependant, en raison des différences entre la résolution spatiale de ces bases de données et entre leur années de mise à jours, des erreurs dans les labels de classes viennent entacher cette donnée de référence lors du traitement et, de fait, limiter la performances des algorithmes de classification.
Dans le cadre des travaux de thèse d’Erwan Giry-Fouquet financé par l’ANR MAESTRIA, un algorithme robuste à ce type de bruit (i.e., bruit dans les labels) a été mis au point et les résultats ont publiés dans la revue Pattern Recognition Letter (https://doi.org/10.1016/j.patrec.2021.10.020). L’idée générale consiste en une première analyse des données à classifier par un algorithme de clustering (étape non perturbée par le bruit dans les labels), puis dans un second temps d’assigner les clusters identifiés automatiquement aux classes pré-définies. L’algorithme proposé permet de trouver l’assignation optimale de manière extrêmement efficace. Cette approche permet de plus de retrouver les différents constituant d’une classe d’occupation des sols, comme illustré ci-dessous.

En termes de qualité de la production cartographique, l’étape de clustering est limitante car difficile à réaliser avec des jeux de données massives de type séries temporelles Sentinel-2. Des travaux sont maintenant en cours pour améliorer cette étape de clustering.
Publication : Erwan Giry Fouquet, Mathieu Fauvel, Clément Mallet, Fast estimation for robust supervised classification with mixture models, Pattern Recognition Letters, 2021, ISSN 0167-8655, https://doi.org/10.1016/j.patrec.2021.10.020.