
Ressources IA de couverture du sol
Des données d’intelligence artificielle au service de la description des territoires.
Dans le cadre de l’observatoire de l’artificialisation des sols, l’IGN pilote la production de données géographiques décrivant l’occupation et l’usage des sols selon la nomenclature OCS GE.
Afin de produire ces données rapidement sur l’ensemble du territoire national et à des coûts maîtrisés, l’IGN mise sur l’intelligence artificielle (IA) pour automatiser les chaînes de production initiale et de mise à jour de ces données.
Titre
Description schématique du processus de production automatisé
- Des méthodes IA permettent d’extraire automatiquement sur des images aériennes ou spatiales des informations non modélisées dans les bases de données existantes. C’est notamment la puissance des méthodes d’apprentissage profond qui permet de reconnaître automatiquement des objets (bâti, arbre, surface de bitume…) et d’en délimiter les contours (on parle de segmentation sémantique d’images).
- Ces informations sont combinées à des données issues de bases de données géographiques existantes pour produire automatiquement les couches Couverture et Usage de l’OCS GE.
- Celles-ci font enfin l’objet d’une phase de contrôle et de correction.
Étape préalable : l’entrainement des modèles
Les modèles deep learning retenus pour automatiser l’extraction de certains objets sont composés de millions de paramètres, qui sont ajustés via une phase dit d’apprentissage, sur la base d’un très grand nombre d’exemples de ce que l’on souhaite en sortie du modèle. En d’autres termes, et de façon un peu simplifiée, on saisit des exemples de ce que l’on veut que le modèle produise (des contours de bâtiments, d’arbres, de surface de bitume, etc.). Le modèle teste une infinité de combinaison de paramétrage jusqu’à celui qui permet de produire le résultat le plus proche des exemples (également appelés annotations). Cette phase de paramétrage ou d’entrainement des modèles demande une capacité de calcul exceptionnelle.
S’agissant du département du Gers, les annotations ont été produites au département, sur deux millésimes. Pour le reste de la production, les annotations seront dorénavant produites à l’échelle du territoire national.
1. inférence du modèle
Cette étape consiste à appliquer le modèle correctement paramétré sur toute la zone d’intérêt, qui peut être un département par exemple. Le résultat (également appelé prédiction) est une image dont la radiométrie des pixels est proportionnelle à la probabilité d’appartenance à une classe de la nomenclature définie en amont, différente de la nomenclature OCS GE .
2. vectorisation et combinaison avec des données pré-existantes
Cette image, représentée sous forme de carte de chaleur, est ensuite vectorisée. Les objets au format vecteur qui en découlent sont combinés à des objets de bases de données géographiques pré-existantes, comme le référentiel parcellaire graphie (RPG), la BD TOPO ou la BD Foret pour former une première version de l’OCS GE (couches couverture et usage).
3. contrôle et corrections
Ces couches sont enfin proposées à des photo-interprètes pour complètement et correction.
Données issues des prédictions deep learning 2019 sur le Gers (inférence du modèle – étape 1)
Titre
Diffusion des données intermédiaires du processus de production automatisée par IA de l’OCS GE
L’IGN va diffuser progressivement divers codes et données, notamment les annotations, c’est-à-dire les données créées pour entraîner des modèles de segmentation sémantique.
Dans un premier temps la diffusion ouverte concerne l’intégralité des données intermédiaires conçues pour la production automatisée des données OCS GE sur le département du Gers. Il s’agit :
1. des annotations saisies au format vecteur sur deux millésimes d’orthoimages couvrant le département du Gers | ![]() |
2. de ces mêmes données formatées pour entraîner des modèles d’apprentissage profond (annotations rasterisées complétées par des observations issues de la BD ORTHO et des différences entre modèles numériques de surface et modèles numériques de terrain ) | ![]() |
3. des prédictions réalisées par inférence des modèles entraînés sur tout le département | ![]() |
4. de la combinaison de ces prédictions aux bases de données existantes (RPG, BD Forêt notamment) qui produit une version de la base d’OCS GE avant l’ultime phase de contrôle et corrections par des photo-interprètes. |
L’ensemble des données est diffusé en open data (licence ouverte Etalab 2.0).
Dans un second temps, comme des annotations réparties sur l’ensemble du territoire national auront été produites, un nouveau modèle d’apprentissage profond, dit « France entière » sera entraîné, et permettra de générer des prédictions ainsi que des produits OCS GE avant contrôle sur des zones prototypes des départements inscrits à l’agenda de production 2022. Ces données seront prochainement diffusées sur la page des géoservices.
L’IGN lancera ensuite des défis à la communauté scientifique qui, ainsi, pourra d’une part contribuer à lever des verrous résiduels de la chaîne de production et d’autre part bénéficier de jeux de données d’apprentissage déjà formatées pour les modèles de segmentation sémantique.
Tout au long du projet, la diffusion progressive d’autres données, codes et défis permettra 1) d’associer des experts IA à l’ambitieux projet de produire des données de description de l’occupation et de l’usage des sols de qualité selon la nomenclature OCS GE, 2) d’enrichir en mode collaboratif le jeu de d’annotations conçu pour l’OCS GE afin de l’élargir à d’autres problématiques d’observation de la terre et 3) d’impliquer davantage les utilisateurs de la donnée dans sa conception.
Titre
Téléchargement
1 - Annotations
- Annotations Gers 2019
- Annotations Gers 2016 - A venir
2 - Jeu de données Deep Learning
- Jeu de données Deep learning Gers 2019 - partie 1 - partie 2
- Jeu de données Deep learning Gers 2016 - A venir
3 - Modèles Deep Learning
- Modèle Deep learning départemental 2019
- Modèle Deep learning départemental 2016 - A venir
4a - Predictions complète Deep learning 2019 - 2016
4b - Prediction Deep learning naf argmax
4c - Prediction Deep learning naf vectorisée
Les données OCSGE 2016 et 2019 sur le département du Gers sont disponibles ici.
Titre
Producteur
