IGN

Géoservices IGN

Annexe : témoignages

Département de la Seine-Saint-Denis - interview de David Delhorme

David Delhorme est géomaticien au département de Seine-Saint-Denis (CD93). Dans cette courte interview, il nous fait part de son expérience de géocodage pour les besoins du département, ainsi que de développeur d’un frontal web interne de géocodage de masse avec correction d’erreur.

Quel type de géocodage pratiquez-vous ?

Réponse :Au département de la Seine-Saint-Denis nous avons un besoin régulier de géocodage de fichiers contenant des adresses.

Ces fichiers tableurs sont issus le plus souvent de nos Directions métiers, et nous les rendons géographiques pour les proposer sur notre plateforme géographique Géoportail93 http://geoportail93.fr.

Pour ce faire, nous avons développé un outil de géocodage directement intégré sur notre portail cartographique qui permet d’importer un fichier CSV, de sélectionner les champs composant l’adresse compléte (n°+typede voie+nom de la voie+code ville INSEE/postal), de le géocoder et de visualiser le résultat directement sur l’interface cartographique.

Quels sont les référentiels utilisés ?

Réponse : notre géocodeur utilise 5 référentiels adresses : BD Adresse, RIL INSEE, BAN, BANO et Cadastre DGFIP. Une adresse est donc géocodée 5 fois avec chacun de ces référentiels ; le référentiel avec le meilleur géocodage est proposé comme résultat.

Un outil de correction interactif permet de vérifier le positionnement des résultats et de corriger les adresses mal géocodées pour les re-géocoder.

Avez-vous des cas particuliers mal traités (CEDEX, lieux-dits…) ?

Réponse : Les adresses que nous utilisont se limitent le plus souvent à la Seine-Saint-Denis, ne comportent pas de CEDEX, ni de lieux-dits, exceptées quelques adresses : La Plaine Saint-Denis(commune de Saint-Denis).

Quelles sont les limites de votre solution ? À quelles autres solutions faites-vous appel ?

Réponse : notre solution est satisfaisante pour de petits jeux de données (inférieur à 3000 lignes). Au delà, le temps nécessaire explose dû au 5 processus de géocodage par adresse. La précision du géocodage était prioritaire sur le délai de traitement. Pour les gros jeux de données, nous utilisons le géocodeur de adresse.data.gouv.fr

Propos recueillis le 29 novembre 2016

Prestations de géocodage sur mesure à l’IGN

Interview de Didier Bouteloup et Etienne Dumont

Didier Bouteloup dirige le département des produits externes à l’IGN. Avec Etienne Dumont, ils répondent aux demandes spécifiques de clients portant sur le géocodage d’importants fichiers d’adresses.

Question : à l’IGN, vous réalisez des prestations de géocodage pour de gros fichiers d’adresses. De quels volumes s’agit-il ? Quel est le profil de vos clients ?

Réponse : Nous avons récemment réalisé deux prestations de géocodage sur plusieurs millions d’adresses (1700 000 et 2 500 000), Avant nous ne réalisions pas ce type de prestation car nous n’avions pas d’outil de géocodage « certifié IGN » capable de réaliser de tels volumes.

Quelle(s) solution(s) de géocodage utilisez-vous en amont ? Comment la mettez-vous en œuvre ?

Réponse : nous utilisons le logiciel monGeocodeur http://professionnels.ign.fr/geocodeurs.

Nous lançons le logiciel en parallèle sur plusieurs postes pour améliorer la vitesse du service  (la vitesse du locigiel est d’environ 20 000 à 30 000 adresses à l’heure. Avec cette méthode, on passe à 90 000 voir 120 000 adresses à l’heure.

Par contre c’est un peu plus contraignant au niveau de la réalisation de la prestation, il faut avoir à disposition des postes informatiques disponibles pour exécuter le logiciel, il fait également créer des sous-ensembles des fichiers à traiter puis les agréger pour produire les résultats finaux.

En quoi consiste l’évaluation de la qualité des adresses de l’échantillon fourni par le client ? La qualité du fichier en entrée influe-t-elle sur le prix ?

Réponse : Lors de chaque prestation de geocodage, nous analysons la base du client. Cette étape nous permet d’estimer la qualité de la base du client et ainsi anticiper sur la qualité du geocodage.

Si la base du client comporte des anomalies, nous pouvons le prévenir que le résultat du geocodage ne sera pas forcément très bon. Nous avons donc une estimation sur la qualité de composition de l’adresse du client, ensuite nous nous appuyons sur le facteur de qualité fourni en sortie par mon geocodeur.

Nous passons un filtre géométrique pour vérifier que les adresses sont localisés dans le département correspondant au code INSEE ou code postal du fichier de base pour éviter les erreurs « grossières »

Vous demande-t-on de géocoder à la parcelle ou à l’IRIS ? Quelle méthode utilisez-vous, pour quel biais ?

Réponse : Le logiciel permet d’identifier le localisant parcellaire associé à l’adresse mais ne permet pas actuellement d’associer l’IRIS correspondante. La méthode d’appariement pour retrouver l’identifiant de la parcelle pourrait bénéficier des informations contenues dans le produit ADRESSE-PREMIUM de l’IGN, dans la version actuellement diffusée je ne pense pas que cette méthode soit utilisée.

Vous arrive-t-il de ne pas pouvoir répondre à une demande ? Pourquoi ?

Réponse : Pas depuis la finalisation du développement du logiciel Mongéocodeur. Les principaux freins étaient des temps de calculs prohibitifs pour des gros volumes de données.

Quelles sont les principaux manques selon vous dans les outils de géocodage en général ?

Réponse : Certaines fonctionnalités ne sont pas encore développées dans le logiciel actuellement utilisé :

Propos recueillis le 4 janvier 2017

API du service géocodage du Géoportail à l’IGN interview de Thibault Coupin

Thibault Coupin est chef de la division Services au pôle Géoportail. Entre autres missions, il a intégré le service de géocodage du géoportail. Dans cette interview, il nous en détaille les principes de fonctionnement et de modélisation des données sources.

Vous êtes chef de la division services du pôle de développement Géoportail, et mainteneur du service de géocodage. De quoi s’agit-il ?

Il s’agit de géocodage d’adresses, de lieux-dits ou de parcelles cadastrales accessibles en 3 modes :

Quel est le modèle d’organisation des données ?

Le géocodage direct a un modèle assez simple : on a des communes, contenant des tronçons de voie, chacun délimité par une adresse de début et une adresse de fin. Il existe aussi des liens entre communes, utilisés par exemple pour les arrondissements de Paris et des quartiers tels que La Défense.

Dans le modèle, les toponymes sont modélisés comme des communes, sinon on ne pourrait pas trouver le toponyme sans spécifier la commune (une contrainte du moteur Géoconcept). Mais pour éviter que les recherches de communes soit “noyées” par les lieux-dits presque synonymes, le moteur recherche en premier lieu dans les toponymes qui sont des communes, avant d’élargir la recherche s’il n’y a pas de résultat.

Le moteur de géocodage est “nourri” de différentes données IGN. Pour l’adresse, on exploite les bases de données suivantes :

La BD Adresse, en effet, ne contient pas les toponymes (lieux-dits).

De la BD Adresse, on ne retient que les points adresse qui sont positionnés avec la précision du numéro de rue (sinon, on exploite le tronçon de voie pour interpolation).

Mais sur géocodage inverse adresse : on supprime commune et voie. (laisser le géocodeur sait interpoler)

Quelle est la stratégie de recherche ?

Pour le géocodage direct d’adresse, on essaie de trouver une commune, puis on cherche le tronçon dans cette commune et enfin, la plaque adresse.

S’ajoutent à ces critères hiérarchiques la possibilité de filtrer sur différentes composantes, par exemple la rue ou le type de lieu.

On différencie la recherche (portant sur les données du filtrage (portant sur les métadonnées).

Comment fonctionne le géocodage inverse ?

On utilise PostGIS pour travailler sur la géométrie brute.

La recherche peut se faire de différentes façons. On soumet au choix :

Ces paramètres sont alors exploités directement dans la requête PostGIS.

La réponse contient la distance entre la géométrie de l’entité résultante et le centroïde de la géométrie désignée par la requête (rectangle ou disque).

Pour le géocodage inverse d’adresses, on ne renvoie que des points adresse.

Comment fonctionne le géocodage de parcelles ?

Pour le géocodage de parcelles, le modèle est différent car on est hors de l’utilisation classique du géocodeur Géoconcept (basé sur des modèles “UGC”) alors qu’on ne fait pas d’analyse syntaxique pour le cadastre : la base de données cadastrales est interrogée directement avec les paramètres suivants :

Le géocodage inverse de parcelles se fait par requête spatiale du point demandé en intersectant sur la surface des polygones de parcelles. Toutes les parcelles ne sont cependant pas disponibles en polygones (seules 90 % des parcelles de Frances ont été numérisées à ce jour). Pour contourner ce manque, on ajoute des localisants (ponctuels) de ces parcelles, ce qui signifie que la recherche de ces parcelle se fera par proximité du point recherché au centre des parcelles.

Comment fonctionne le mode autocomplétion ?

Il doit interpréter des adresses que l’utilisateur à commencé à saisir, en faisant la correspondance sur le début, sans tenir rigueur de son état tronqué. On doit ainsi reconnaître les différentes formes d’acritures d’une adresse :

Les adresses sont ainsi indexées sous ces différentes formes pour permettre la correspondance sur le début de la saisie, grâce à une base de données clefs/valeurs. Le moteur ne tolère aucune erreur.

À l’adresse recherchée s’ajoute un filtrage éventuel, par exemple sur le territoire métropolitain, un DOM-TOM ou un département. En interne, le moteur de géocodage nous contraint à filtrer sur la ville ou le code postal.