Tout savoir sur les outils pour comparer et mélanger ses données de transport

les silos

De plus en plus d’informations sur les transports publics sont aujourd’hui disponibles, que ce soit à travers des portails open data ou à travers des projets collaboratifs comme OpenStreetMap ou Wikipédia.

les silos

Cela ouvre la voie à de nouvelles formes d’utilisation de ces données qui n’étaient pas possibles auparavant, comme par exemple :

  • compléter ses propres données au format GTFS avec des tracés issus d’OpenStreetMap
  • ajouter un encart Wikipédia détaillant l’histoire d’une gare ou d’une station de métro en plus des informations utiles au voyageur
  • comparer les positions et labels de ses données de transport avec OpenStreetMap pour détecter et corriger des erreurs, comme le font Île-de-France Mobilités et Entur
  • etc

Mobility database

Afin de faciliter ces nouveaux usages, le projet Mobility Database a pour objectif d’attribuer des identifiants uniques et partagés entre les sources pour les différents objets de transport (arrêts, lignes, opérateurs, etc).

Ce projet est porté par MobilityData, une fondation Canadienne qui réunit des acteurs de la mobilité afin de faire évoluer les formats d’échange de données (dont le GTFS) pour améliorer la qualité et la précision de l’information voyageur au bénéfice de tous.

Pour préparer ce projet ambitieux, Jungle Bus a réalisé pour MobilityData une étude des différents modèles pour représenter des données de transport dans les projets collaboratifs (OpenStreetMap et Wikidata) et les formats d’échanges (GTFS et NeTEx) ainsi qu’une analyse comparative des différents outils pour comparer et fusionner des données de sources différentes et importer des données de transport dans OpenStreetMap et Wikidata.

Vous pouvez retrouver ces deux études complètes en anglais sur notre site :

Vous pensez qu’OpenStreetMap ou d’autres projets collaboratifs peuvent venir améliorer vos données ou procédures ? Nous pouvons vous accompagner dans cette réflexion, contactez-nous !

Utiliser OpenStreetMap pour améliorer ses propres données transport ? Étude de cas

Notre expérience en France et notre audit des données open data en Île-de-France l’ont montré, les données officielles qu’utilisent les collectivités ou les opérateurs de transport sont perfectibles. Le nommage des arrêts n’est pas toujours conforme à la signalétique et les positions sont parfois approximatives.
Les conséquences pour les voyageurs peuvent être très impactantes : sans connaissance du réseau, il peut être difficile de trouver son arrêt ou d’effectuer sa correspondance dans de bonnes conditions.

Chez Jungle Bus, nous pensons qu’OpenStreetMap et sa communauté peuvent apporter des réponses efficaces à ces problèmes de données. Et nous ne sommes pas les seuls à faire ce pari.

Aujourd’hui, nous vous proposons une étude de cas sur l’expérience de la Norvège.

Retour d’expérience : Ministère des transports de Norvège

Depuis plusieurs années, Entur, une entité dépendante du ministère des Transports et des Communications anime et organise les échanges avec la soixantaine d’opérateurs de transport en bus, train, tram, métro ou encore ferry du pays. Son objectif est de permettre de fournir la meilleur information et accessibilité aux transports à l’échelle du territoire.
Parmi ses différentes missions, Entur collecte les arrêts de tous ces opérateurs et les consolide dans une base, qui est redistribuée en open data dans un format normalisé.

Les opérateurs ont l’obligation d’alimenter cette base avec les arrêts de leur réseau, avec notamment le nom officiel, la position où les voyageurs montent à bord et un identifiant de référence. Cette base contient ainsi près de 100 000 arrêts et est mise à jour quotidiennement.

logo entur. Source : https://en.wikipedia.org/wiki/File:EnTur_logo.png

Cette démarche simplifie et donc favorise l’intermodalité : les différentes options de transport d’un lieu sont plus facilement interconnectables même si elles sont gérées par des opérateurs et des entités différentes.
Pourtant, même avec un cahier des charges précis comme celui préconisé par Entur pour remonter les informations sur les arrêts, les erreurs viennent régulièrement se glisser dans les données et mettre des bâtons dans les roues des voyageurs.

Avant tout : compléter OpenStreetMap

Pour y remédier, Entur a choisi de miser sur OpenStreetMap.

En effet, comme beaucoup d’acteurs de la mobilité, Entur utilise déjà OpenStreetMap pour tous ses calculs d’itinéraires à pied, en voiture et en correspondance avec les transports. L’équipe d’Entur contribue et travaille déjà avec la communauté pour améliorer les données de voiries, en particulier aux abords des gares et autres grands hubs de mobilité.

La première étape a consisté à ajouter dans OpenStreetMap les informations utiles collectées par Entur : position, nom, équipements, et bien sûr l’identifiant de référence dans la base nationale.

Cette étape a eu lieu en mars 2019 pour la majorité des régions ; le travail est encore en cours dans les deux dernières régions, où la qualité de la base nationale n’est pas assez bonne pour permettre une modification d’OpenStreetMap de cette ampleur.

Réconcilier les données tous les mois

Puis, tous les mois, la base nationale des arrêts et les arrêts d’OpenStreetMap sont comparés, à l’aide de l’identifiant de référence.
Les arrêts qui ont été créés ou modifiés suite à des restructurations de réseaux sont ainsi ajoutés à OpenStreetMap.
Puis les arrêts déjà existants qui ont été édités dans OpenStreetMap sont extraits : il s’agit en effet d’arrêts que la communauté locale a modifiés, par exemple pour corriger une position ou un nom.

Toutes ces modifications sont étudiées par Entur, qui contacte alors les opérateurs pour vérifier l’information. Bien souvent, la communauté OpenStreetMap vient corriger des informations imprécises ou erronées dans la base de données officielle.
Il s’agit majoritairement de petites modifications sur la précision du positionnement des arrêts. Mais cela permet aussi régulièrement d’identifier des zones où des travaux de voiries ont modifié l’accès au réseau de transport.

Ces informations sur la voiries peuvent en effet mettre du temps à remonter et à se répercuter dans la base officielle : le travail de terrain et la connaissance locale des contributeurs OpenStreetMap permet de gagner un temps précieux et d’améliorer la qualité de l’information voyageur en Norvège.

Le cas de la Finlande

D’autres pays suivent d’ailleurs déjà cet exemple : la Finlande par exemple a déjà constitué sa base nationale d’arrêts pour des raisons similaires et a récemment complété les arrêts présents dans OpenStreetMap à l’aide de ces informations officielles en provenance des opérateurs.

Des différences avec la France

La communauté locale dans ces pays est pourtant bien moins active qu’en France :
moins de 30 % des arrêts étaient déjà dans OpenStreetMap avant l’enrichissement initial réalisé par Entur.

À l’inverse en France, le projet BATO, une étude collégiale réalisée en 2016 à la suite de la réunion annuelle des contributeurs OpenStreetMap avait montré qu’il y avait plus d’arrêts dans OpenStreetMap que dans les bases disponibles en open data.

La France est d’ailleurs dans le top 5 des pays les plus actifs en termes de contributions à OpenStreetMap.

De nombreuses solutions restent à inventer pour co-construire une meilleure information voyageur en s’appuyant sur la communauté OpenStreetMap. Jungle Bus apporte sa pierre à l’édifice pour que cette vision devienne réalité.

Vous aussi, vous voulez utiliser le potentiel d’OpenStreetMap et de sa communauté pour enrichir vos données de mobilité et améliorer l’information voyageur ? Contactez-nous !

Les données de transport en Île-de-France dans OpenStreetMap : un potentiel largement inexploité

Bus à Montmartre

Chaque jour, près de 10 millions de déplacements sont effectués dans les transports publics de la région Île-de-France, sur un réseau de plus d’un millier de lignes, opérées par environ 75 transporteurs. Île-de-France Mobilités (ex-STIF) imagine, organise et finance les transports publics dans toute la région.

Un an d’analyse de données transport open data en Île-de-France

Jungle Bus a étudié pendant un an l’évolution des données transports en commun en Île-de-France à la fois dans OpenStreetMap et dans les référentiels officiels publiés en open data par Île-de-France Mobilités.

Bus à Montmartre

Et voici ce que nous avons trouvé.

OpenStreetMap : une cartographie de qualité bien qu’incomplète

Les données officielles d’Île-de-France Mobilités sont plus complètes que celles d’OpenStreetMap : en effet, dans OpenStreetMap, les zones moins habitées, qui sont aussi celles où il y a moins de contributeurs, sont moins bien cartographiées.

Les départements de la grande couronne sont donc ceux où il manque le plus d’informations.

des contributions OpenStreetMap hétérogènes
Rapport entre le nombre d’arrêts officiels et le nombre d’arrêts dans OpenStreetMap

Une modélisation qui diffère

Par ailleurs, les données sont modélisées de manière très différente.
OpenStreetMap contient des données purement géographiques tandis que les données officielles décrivent l’offre complète, ce qui inclut également les horaires de passage des bus.
De plus, OpenStreetMap reproduit ce qui est visible sur le terrain tandis que les données officielles peuvent parfois représenter des données logiques ou agrégées.
Par exemple la définition d’un arrêt n’est pas commune aux deux référentiels.

des modélisations différentes
Un arrêt sur le terrain et dans OpenStreetMap peut parfois correspondre à plusieurs arrêts dans les données open data officielles

Pour notre étude, nous avons dû re-modéliser les données des deux sources afin de construire un échantillon comparable.

Même si les différences entre les deux jeux de données restent marginales dans cet échantillon comparable OpenStreetMap nous a permis d’identifier de nombreux arrêts où les données publiées en open data peuvent être améliorées.

OpenStreetMap proche de la réalité terrain

En effet, les données d’OpenStreetMap sont en général très proches de la réalité observable sur le terrain : le nommage des lignes et des arrêts peut donc être plus conforme avec la signalétique, les positions des arrêts sont souvent plus précises, le tracé des lignes est également plus précis et suit exactement le tracé des rues empruntées.

En analysant les différences de position entre les deux sources, nous avons pu trouver des arrêts de l’open data officiel situés dans la mauvaise rue mais aussi à des positions incongrues comme à l’intérieur de bâtiments ou même d’un étang.
Au total, près de 5% des arrêts comparés ont un écart de position entre les deux sources de plus de 70 mètres.

des différences sur les positions des arrêts
Les positions des arrêts dans OpenStreetMap sont souvent plus proches de la réalité que les positions proposées par l’open data officiel

Ces positions potentiellement erronées peuvent pénaliser un voyageur qui recherche son arrêt. Dans un contexte de développement fort de la multi-modalité, ces données n’ont pas la précision nécessaire pour réaliser un guidage piéton de qualité.
Ces positions pourraient être corrigées en s’appuyant sur le travail des contributeurs : les données d’OpenStreetMap sont en effet exploitables car disponibles sous licence libre.

La communauté OpenStreetMap produit de plus en plus de données

En un an d’étude, le volume de notre échantillon comparable a été multiplié par 4 !
Ainsi, si OpenStreetMap n’est pas complet, la contribution y est donc extrêmement active : la communauté a amélioré sensiblement la couverture et a cartographié des dizaines de milliers d’objets au cours de l’année.
Elle a notamment su se mobiliser pour qu’OpenStreetMap reste à jour suite aux diverses restructurations de réseau qui ont eu lieu pendant l’année, par exemple à l’occasion des réorganisations diverses de la rentrée 2018 ou encore la refonte du réseau de bus parisien en avril 2019.

évolution du nombre de routepoints pendant un an d'étude
La contribution dans OpenStreetMap sur les sujets transport est très active : des dizaines de milliers d’objets ont été cartographiés en un an !

Conclusion

La communauté OpenStreetMap s’est mobilisée pour continuer le travail minutieux de collecte terrain des données de transport en Île-de-France.
Par ailleurs, Île-de-France Mobilités continue sa stratégie open data, notamment via la publication du tracé des lignes en 2019.

Bien que les données OpenStreetMap ne soient pas complètes, leur qualité permet dès à présent de les exploiter pour identifier des erreurs dans les données open data et les corriger.

Il existe donc un réel intérêt pour les professionnels du transport à travailler avec la communauté pour améliorer les données de transports. De la création des données à son utilisation, de nombreuses solutions ne demandent qu’à être construites.

Audits complets

Nous vous invitons à lire le rapport d’audit initial et que ses 4 mises à jour successives pour en savoir plus sur notre méthodologie, nos indicateurs ainsi que le détail des enrichissements réalisables.


Ces audits ont été réalisés grâce au soutien de Cityway et d’Île-de-France Mobilités, dans le cadre du projet m2i.

logo idfm
logo cityway

Vous souhaitez connaître la qualité des données OpenStreetMap sur votre territoire ? Elles peuvent sûrement enrichir vos propres données et améliorer l’information voyageurs.

Contactez-nous, c’est notre expertise.


Licence photo « Bus à Montmartre » CC-By Chris Waits

Audit Île-de-France – Mise à jour de novembre

Jungle Bus présente un nouvel audit comparatif des données de transport d’Île-de-France.

Dans ce document, notre équipe constate la progression de la cartographie du réseau de bus dans OpenStreetMap et se focalise en particulier sur les arrêts situés autour des gares Transilien du RER C qui ont fait l’objet d’une cartographie exhaustive.

Ce document fait suite à la deux premières versions de l’audit : publiée en avril 2018 puis celle publiée en juillet 2018.