Visuel
Image

Ressources IA de couverture du sol

Contenu de gauche
Texte

Des données d’intelligence artificielle au service de la description des territoires.

Texte

Dans le cadre de l’observatoire de l’artificialisation des sols, l’IGN pilote la production de données géographiques décrivant l’occupation et l’usage des sols selon la nomenclature OCS GE.


Afin de produire ces données rapidement sur l’ensemble du territoire national et à des coûts maîtrisés, l’IGN  mise sur l’intelligence artificielle (IA) pour automatiser les chaînes de production initiale et de mise à jour de ces données.

Titre
Description schématique du processus de production automatisé

Texte
  1. Des méthodes IA permettent d’extraire automatiquement sur des images aériennes ou spatiales des informations non modélisées dans les bases de données existantes.  C’est notamment la puissance des méthodes d’apprentissage profond qui permet de reconnaître automatiquement des objets (bâti, arbre, surface de bitume…) et d’en délimiter les contours (on parle de segmentation sémantique d’images). 
  2. Ces informations sont combinées à des données issues de bases de données géographiques existantes pour produire automatiquement  les couches Couverture et Usage  de l’OCS GE. 
  3. Celles-ci font enfin l’objet d’une phase de contrôle et de correction.

Étape préalable : l’entrainement des modèles

Les modèles deep learning retenus pour automatiser l’extraction de certains objets sont composés de millions de paramètres, qui sont ajustés via une phase dit d’apprentissage, sur la base d’un très grand nombre d’exemples de ce que l’on souhaite en sortie du modèle. En d’autres termes, et de façon un peu simplifiée, on saisit des exemples de ce que l’on veut que le modèle produise (des contours de bâtiments, d’arbres, de surface de bitume, etc.).  Le modèle teste une infinité de combinaison de paramétrage jusqu’à celui qui permet de produire le résultat le plus proche des exemples (également appelés annotations). Cette phase de paramétrage ou d’entrainement des modèles demande une capacité de calcul exceptionnelle.

S’agissant du département du Gers, les annotations ont été produites au département, sur deux millésimes. Pour le reste de la production, les annotations seront dorénavant produites à l’échelle du territoire national.

1.    inférence du modèle

Cette étape consiste à appliquer le modèle correctement paramétré sur toute la zone d’intérêt, qui peut être un département par exemple.  Le résultat (également appelé prédiction) est une image dont la radiométrie des pixels est proportionnelle à la probabilité d’appartenance à une classe de la nomenclature définie en amont, différente de la nomenclature OCS GE . 

2.    vectorisation et combinaison avec des données pré-existantes

Cette image, représentée sous forme de carte de chaleur, est ensuite vectorisée. Les objets au format vecteur qui en découlent sont combinés à des objets de bases de données géographiques pré-existantes, comme le référentiel parcellaire graphie (RPG), la BD TOPO ou la BD Foret pour former une première version de l’OCS GE (couches couverture et usage).

3.    contrôle et corrections

Ces couches sont enfin proposées à des photo-interprètes pour complètement et correction.

Données issues des prédictions deep learning 2019 sur le Gers (inférence du modèle – étape 1)

Titre
Diffusion des données intermédiaires du processus de production automatisée par IA de l’OCS GE

Texte

L’IGN va diffuser progressivement divers codes et données, notamment les annotations, c’est-à-dire les données  créées pour entraîner des modèles de segmentation sémantique. 

Dans un premier temps la diffusion ouverte concerne l’intégralité des données intermédiaires conçues pour la production automatisée des données OCS GE sur le département du Gers. Il s’agit :

1. des annotations saisies au format vecteur sur deux millésimes d’orthoimages couvrant le département du Gers Image 1-
2. de ces mêmes données formatées pour entraîner des modèles d’apprentissage profond (annotations rasterisées complétées par des observations issues de la BD ORTHO et  des différences entre modèles numériques de surface et modèles numériques de terrain ) Image 2 -
3. des prédictions réalisées par inférence des modèles entraînés sur tout le département Image 3 -
4. de la combinaison de ces prédictions aux bases de données existantes (RPG, BD Forêt notamment) qui produit une version de la base d’OCS GE avant l’ultime phase de contrôle et corrections par des photo-interprètes.  Image 4 -

L’ensemble des données est diffusé en open data (licence ouverte Etalab 2.0). 

Dans un second temps, comme des annotations réparties sur l’ensemble du territoire national auront été produites, un nouveau modèle d’apprentissage profond, dit « France entière » sera entraîné, et permettra de générer des prédictions ainsi que des produits OCS GE avant contrôle sur des zones prototypes des départements inscrits à l’agenda de production 2022. Ces données seront prochainement diffusées sur la page des géoservices.

L’IGN lancera ensuite des défis à la communauté scientifique qui, ainsi, pourra d’une part contribuer à lever des verrous résiduels de la chaîne de production et d’autre part bénéficier de jeux de données d’apprentissage déjà formatées pour les modèles de segmentation sémantique.

Tout au long du projet, la diffusion progressive d’autres données, codes et défis permettra 1) d’associer des experts IA à l’ambitieux projet de produire des données de description de l’occupation et de l’usage des sols de qualité selon la nomenclature OCS GE, 2) d’enrichir en mode collaboratif le jeu de d’annotations conçu pour l’OCS GE afin de l’élargir à d’autres problématiques d’observation de la terre et 3) d’impliquer davantage les utilisateurs de la donnée dans sa conception.

 

Titre
Téléchargement

Texte

1 - Annotations

2 - Jeu de données Deep Learning

  • Jeu de données Deep learning Gers 2019 - partie 1 - partie 2
  • Jeu de données Deep learning Gers 2016 - A venir

3 - Modèles Deep Learning

4a - Predictions complète Deep learning 2019 - 2016

4b - Prediction Deep learning naf argmax

4c - Prediction Deep learning naf vectorisée

Les données OCSGE 2016 et 2019 sur le département du Gers sont disponibles ici.

Contenu de droite

Titre
Producteur

Producteur

Titre
Services Web

Titre
Téléchargement

Titre
Documentation

Texte

Spécifications

Contenu du bas

Texte