La production de cartes d’occupation du sol, comment ça marche?
=>
Les cartes d’occupation du sol
Mise à jour 2020 : cet article est maintenant ancien, des informations plus précises sont disponibles sur : http://osr-cesbio.ups-tlse.fr/~oso/
Les approches classiques de production
Les approches automatiques de production de cartes d’occupation du sol à partir d’images de télédétection sont souvent basées sur des méthodes de classification d’images. Cette classification peut être :
- supervisée : on utilise des zones pour lesquelles on connaît l’occupation du sol comme des exemples pour un apprentissage;
- non supervisée : on regroupe les pixels de l’image par similarité et on reconnait les classes ensuite.
La classification supervisée fournit souvent de meilleurs résultats, mais elle nécessite des données de référence pour l’apprentissage qui sont coûteuses à obtenir (campagnes sur le terrain, photo-interprétation, etc.). C’est cependant cette approche qui est utilisée dans les travaux actuels du CESBIO, comme par exemple l’édition d’une carte d’occupation des sols annuelle sur la France (avec LANDSAT 8, en attendant Sentinel-2).
L’apport du multi-temporel
Jusqu’à récemment, les cartes d’occupation du sol à échelle cartographique fine ont été presque exclusivement produites à partir d’un petit nombre de dates et ceci principalement à cause du manque de séries multi-temporelles denses fournies par des capteurs à haute résolution spatiale. L’accent était donc mis sur la richesse spectrale des images pour distinguer les différentes classes d’occupation du sol. Cependant, cette approche « monodate » ne permet pas de distinguer des classes qui auraient la même signature spectrale à une date d’acquisition donnée, mais une signature différente à une autre date (des sols nus qui deviendront des cultures différentes plus tard). Pour pallier à cette difficulté, plusieurs dates peuvent être utilisées, mais cela demande une sélection spécifique de dates en fonction de la nomenclature visée. Par exemple, dans l’image de gauche, acquise au mois de mai, il est très difficile de dire où sont les parcelles de colza et quelles sont les parcelles de blé. Sur l’image de droite, acquise au mois d’avril, les parcelles de colza en fleur sont très faciles à distinguer des parcelles de blé bien vert.
Si l’on souhaite mettre en place des systèmes opérationnels et génériques (indépendants des sites cartographiés et donc des nomenclatures visées), il faut assurer une acquisition d’images fréquente et régulière. Ceci sera rendu possible par la mission Sentinel-2, et déjà, sur les données de démonstration issues de Formosat-2 et SPOT4 (Take 5). En plus, on peut montrer que le fait de disposer d’une haute résolution temporelle peut être plus intéressant que de disposer d’une grande diversité spectrale. Par exemple, la figure suivante montre des résultats de performances de classification (indice \( \kappa \); plus il est élevé, mieux c’est) en fonction du nombre de dates utilisées pour la classification. On a utilisé des images Formosat-2 (4 bandes spectrales) et des simulations Vénµs (12 bandes) et Sentinelle-2 (13 bandes). On constate qu’à partir d’un nombre suffisant de dates utilisées, la richesse spectrale de Vénµs et Sentinelle-2 est rattrapée par une description fine du comportement temporel obtenu avec le simple capteur Formosat-2.
Ce qui peut être attendu de Sentinelle-2
Sentinelle-2 a des caractéristiques uniques dans le paysage des systèmes d’observation de la Terre :
- fauchée de 290 km.;
- résolution spatiale de 10 à 60 m. en fonction des bandes spectrales;
- revisite de 5 jours (avec 2 satellites);
- 13 bandes spectrales.
Les systèmes de résolution spatiale comparable (SPOT ou Landsat) ont des revisites plus faibles et moins de bandes spectrales. Les systèmes de revisite similaire, ont une résolution spatiale plus faible (MODIS) ou des fauchées réduites (Formosat-2). Avec le type de données fournies par Sentinelle-2 il est possible d’envisager le développement de systèmes de production de cartes d’occupation du sol capables d’actualiser les informations une fois par mois à l’échelle globale. La dimension temporelle, permettra de distinguer des classes dont les signatures spectrales sont très proches pendant une grande partie de l’année. La résolution spatiale améliorée permettra de travailler avec des unités minimales de cartographie plus fines. Cependant, la mise en oeuvre opérationnelle de tels systèmes nécessitera une attention particulière aux besoins de validation des produits générés et aux énormes volumes de données à traiter. Les cartes d’occupation produites par un tel système devront suivre une validation à échelle régionale, voire globale. De plus, comme les données de référence seront limitées, il faudra se passer au maximum de techniques d’apprentissage et essayer d’intégrer des connaissances a priori (physiques ou expertes) dans les chaînes de traitement. Enfin, même si la capacité d’acquisition des nouveaux systèmes spatiaux sera améliorée, il y aura toujours des trous dans les données (nuages, par exemple). Les chaînes de traitement devront donc savoir combler ces trous, ou en tout cas y être robustes.
Les travaux du CESBIO
Danielle Ducrot, Antoine Masse et de nombreux stagiaires du CESBIO ont fabriqué récemment une grande carte d’occupation des sols sur la chaîne des Pyrénées à partir de données multi-temporelles de LANDSAT à 30 mètres de résolution. Cette carte, qui représente un vrai travail d’orfèvre, contient 70 classes. Elle a été réalisée en trois parties à partir des images peu nuageuses collectées par les satellites Landsat au cours de l’année 2010.

Dans sa thèse, Antoine travaille sur les méthodes qui permettent de sélectionner les meilleures dates pour réaliser une classification. De son côté, Isabel Rodes s’intéresse aux méthodes qui permettent d’utiliser toutes les images disponibles sur des zones très étendues tout en gérant les données manquantes (nuages, ombres) et le fait que tous les pixels ne sont pas vus aux mêmes dates. Ces 2 approches sont complémentaires : l’une permet de travailler avec des nomenclatures très détaillées, mais demande l’intervention d’opérateurs humains, l’autre est complètement automatique, mais moins ambitieuse en termes de détails de la classification. Une troisième approche est explorée au CESBIO dans le cadre de la thèse de Julien Osman : l’utilisation de connaissances a priori de type quantitatif (à partir de données historiques) et qualitatif (connaissances d’experts thématiques) pour guider les systèmes de classification automatique. Nous vous décrirons plus en détails ces différentes approches dans des billets à venir.