Validation des masques de nuages de MACCS

=>Lors du bilan annuel de l’exploitation du projet PEPS (le site miroir des données Sentinel au CNES), la société GEOSYS a présenté ses activités opérationnelles d’utilisation des données Sentinel-2 pour fournir du conseil en agriculture sur de nombreuses zones dans le monde. A cette occasion, GEOSYS nous a présenté sa procédure de détection des nuages sur Sentinel-2. La solution Sen2cor n’a pas été jugée suffisamment fiable par GEOSYS, et les zones traitées par MACCS ne couvrent pas, loin de là, toutes les zones d’intérêt de la société. GEOSYS a donc décidé de faire intervenir des opérateurs pour affiner la notation nuageuse des images. Pour chaque image traitée, les opérateurs fournissent un masque de pixels valides (clairs, sans nuages ni ombres).

J’ai bien entendu sauté sur l’occasion pour proposer à GEOSYS une collaboration visant à comparer les masques de pixels valides issus de MACCS et de la notation manuelle de GEOSYS. C’est dans ce contexte que GEOSYS m’a gracieusement donné accès à quelques-uns de ses masques de nuages à des fins de comparaison avec MACCS. Des données ont été traitées sur 4 tuiles réparties sur la France, sur une période de 3 mois, de décembre 2016 à février 2017 :

SiteTuile
Toulouse31TCJ
Arles31TFJ
Orléans31UDP
Rennes30UWU

 La tuile de Rennes n’a pas donné de résultats, les images sont toutes nuageuses à plus de 90%, mais nous avons pu obtenir de bons résultats de validation sur les autres sites qui sont affichés ci-dessous.

Toulouse20170215confusion %nuage_maccsclair_maccsOA
nuage_geosys54.1811.62
clair_geosys1.6532.5586.73
20170116confusion %nuage_maccsclair_maccsOA
nuage_geosys49.367.3
clair_geosys2.0841.2690.62
Orleans20161130confusion %nuage_maccsclair_maccsOA
nuage_geosys00.55
clair_geosys099.4599.45
20161227confusion %nuage_maccsclair_maccsOA
nuage_geosys1.224.11
clair_geosys1.7692.9194.13
20170126confusion %nuage_maccsclair_maccsOA
nuage_geosys0.812.66
clair_geosys0.1396.497.21
20170215confusion %nuage_maccsclair_maccsOA
nuage_geosys0.241.27
clair_geosys0.1598.3598.59
20161231confusion %nuage_maccsclair_maccsOA
nuage_geosys21.412.67
clair_geosys2.1873.7395.14
Arles20170103confusion %nuage_maccsclair_maccsOA
nuage_geosys2.422.77
clair_geosys0.4194.496.82
20170113confusion %nuage_maccsclair_maccsOA
nuage_geosys29.985.11
clair_geosys3.8961.0391.01
20170202confusion %nuage_maccsclair_maccsOA
nuage_geosys82.652.87
clair_geosys6.77.7790.42
20160209confusion %nuage_maccsclair_maccsOA
nuage_geosys87.934.43
clair_geosys0.237.4195.34

 Ce tableau présente les matrices de confusion obtenues pour chaque date traitée, et la colonne OA  (Overall Accuracy), fournit le pourcentage de pixels bien classés. Celui-ci va de 86% à 99.5%. L’accord est donc excellent. Mais ce sont bien sûr les résultats les moins bons qui nous intéressent le plus, dans le but de comprendre ce qui ne va pas et éventuellement essayer d’améliorer. Vous trouverez ci-dessous deux exemples de désaccords, reportez-vous aux légendes et n’hésitez pas à cliquer sur les images pour les voir à pleine résolution.

 

En conclusion de cette première validation indépendante de nos produits Sentinel-2, GEOSYS et MACCS sont d’accord sur 94.5% des pixels en moyenne, sur 11 images différentes. Les opérateurs de GEOSYS font un travail remarquable et parviennent à détecter même les nuages les plus ténus. Les opérateurs ont cependant tendance à dilater généreusement les zones nuageuses, et à simplifier les polygones en présence de nuages morcelés. Cela s’explique par le fait que GEOSYS tient absolument à éviter les omissions de nuages ou d’ombre, et en même temps, la productivité des opérateurs est meilleure s’ils ne s’acharnent pas à détourer chaque nuage. Les nuages de MACCS sont eux aussi dilatés, mais pas autant que ceux de GEOSYS en général. Dans de rares cas, MACCS peut aussi manquer les nuages les plus ténus, et aussi des nuages plus épais, mais de faible surface. Cela est dû à la résolution utilisée dans MACCS pour calculer le masque de nuages (240 m). Nous comptons augmenter cette résolution, mais cela coûtera un temps de calcul supplémentaire, et il faudra que le segment sol MUSCATE soit beaucoup plus en forme !

 

Ces résultats seront bientôt complétés par la comparaison aux sorties d’autres chaînes de traitement. Ils seront bien sûr présentés dans ce blog, mais aussi par exemple au colloque RAQRS V à Valencia en Septembre.

 

Un grand merci à Arnaud Quesney (de GEOSYS) et à GEOSYS  pour la fourniture de données et leur aide à la rédaction de cet article.

Plus d'actualités

The missing link to valorize CESBIO’s applicative research works

=>  My colleagues at CESBIO are extremely creative! Over the past ten years, they have developed a wide range of new products and methods for extracting information from Copernicus data. They don’t just develop and validate the method on a few sites; they continue their work until they have produced data for the whole of […]

Le chaînon manquant dans la valorisation des travaux de recherche en télédétection

=> Mes collègues du CESBIO sont très créatifs ! Ils ont mis au point, au cours des dix dernières années, un grand nombre de nouveaux produits et de méthodes d’extraction de l’information à partir des données Copernicus (Sentinel-1 et 2). Et bien souvent, ils ne s’arrêtent pas à la mise au point de la méthode […]

Sentinel-2 overtakes Landsat in scientific litterature

OpenAlex is a new, yet already very useful, open database for exploring scientific literature. For an upcoming blog post on the CNES Datacampus website, I analysed the proportion of papers that used only one of the Sentinel-2 or Landsat missions, as well as those that used both, in 2025. What struck me was that Sentinel-2 […]

Rechercher