Les données de transport en Île-de-France dans OpenStreetMap : un potentiel largement inexploité

Chaque jour, près de 10 millions de déplacements sont effectués dans les transports publics de la région Île-de-France, sur un réseau de plus d’un millier de lignes, opérées par environ 75 transporteurs. Île-de-France Mobilités (ex-STIF) imagine, organise et finance les transports publics dans toute la région.

Un an d’analyse de données transport open data en Île-de-France

Jungle Bus a étudié pendant un an l’évolution des données transports en commun en Île-de-France à la fois dans OpenStreetMap et dans les référentiels officiels publiés en open data par Île-de-France Mobilités.

Bus à Montmartre

Et voici ce que nous avons trouvé.

OpenStreetMap : une cartographie de qualité bien qu’incomplète

Les données officielles d’Île-de-France Mobilités sont plus complètes que celles d’OpenStreetMap : en effet, dans OpenStreetMap, les zones moins habitées, qui sont aussi celles où il y a moins de contributeurs, sont moins bien cartographiées.

Les départements de la grande couronne sont donc ceux où il manque le plus d’informations.

des contributions OpenStreetMap hétérogènes
Rapport entre le nombre d’arrêts officiels et le nombre d’arrêts dans OpenStreetMap

Une modélisation qui diffère

Par ailleurs, les données sont modélisées de manière très différente.
OpenStreetMap contient des données purement géographiques tandis que les données officielles décrivent l’offre complète, ce qui inclut également les horaires de passage des bus.
De plus, OpenStreetMap reproduit ce qui est visible sur le terrain tandis que les données officielles peuvent parfois représenter des données logiques ou agrégées.
Par exemple la définition d’un arrêt n’est pas commune aux deux référentiels.

des modélisations différentes
Un arrêt sur le terrain et dans OpenStreetMap peut parfois correspondre à plusieurs arrêts dans les données open data officielles

Pour notre étude, nous avons dû re-modéliser les données des deux sources afin de construire un échantillon comparable.

Même si les différences entre les deux jeux de données restent marginales dans cet échantillon comparable OpenStreetMap nous a permis d’identifier de nombreux arrêts où les données publiées en open data peuvent être améliorées.

OpenStreetMap proche de la réalité terrain

En effet, les données d’OpenStreetMap sont en général très proches de la réalité observable sur le terrain : le nommage des lignes et des arrêts peut donc être plus conforme avec la signalétique, les positions des arrêts sont souvent plus précises, le tracé des lignes est également plus précis et suit exactement le tracé des rues empruntées.

En analysant les différences de position entre les deux sources, nous avons pu trouver des arrêts de l’open data officiel situés dans la mauvaise rue mais aussi à des positions incongrues comme à l’intérieur de bâtiments ou même d’un étang.
Au total, près de 5% des arrêts comparés ont un écart de position entre les deux sources de plus de 70 mètres.

des différences sur les positions des arrêts
Les positions des arrêts dans OpenStreetMap sont souvent plus proches de la réalité que les positions proposées par l’open data officiel

Ces positions potentiellement erronées peuvent pénaliser un voyageur qui recherche son arrêt. Dans un contexte de développement fort de la multi-modalité, ces données n’ont pas la précision nécessaire pour réaliser un guidage piéton de qualité.
Ces positions pourraient être corrigées en s’appuyant sur le travail des contributeurs : les données d’OpenStreetMap sont en effet exploitables car disponibles sous licence libre.

La communauté OpenStreetMap produit de plus en plus de données

En un an d’étude, le volume de notre échantillon comparable a été multiplié par 4 !
Ainsi, si OpenStreetMap n’est pas complet, la contribution y est donc extrêmement active : la communauté a amélioré sensiblement la couverture et a cartographié des dizaines de milliers d’objets au cours de l’année.
Elle a notamment su se mobiliser pour qu’OpenStreetMap reste à jour suite aux diverses restructurations de réseau qui ont eu lieu pendant l’année, par exemple à l’occasion des réorganisations diverses de la rentrée 2018 ou encore la refonte du réseau de bus parisien en avril 2019.

évolution du nombre de routepoints pendant un an d'étude
La contribution dans OpenStreetMap sur les sujets transport est très active : des dizaines de milliers d’objets ont été cartographiés en un an !

Conclusion

La communauté OpenStreetMap s’est mobilisée pour continuer le travail minutieux de collecte terrain des données de transport en Île-de-France.
Par ailleurs, Île-de-France Mobilités continue sa stratégie open data, notamment via la publication du tracé des lignes en 2019.

Bien que les données OpenStreetMap ne soient pas complètes, leur qualité permet dès à présent de les exploiter pour identifier des erreurs dans les données open data et les corriger.

Il existe donc un réel intérêt pour les professionnels du transport à travailler avec la communauté pour améliorer les données de transports. De la création des données à son utilisation, de nombreuses solutions ne demandent qu’à être construites.

Audits complets

Nous vous invitons à lire le rapport d’audit initial et que ses 4 mises à jour successives pour en savoir plus sur notre méthodologie, nos indicateurs ainsi que le détail des enrichissements réalisables.


Ces audits ont été réalisés grâce au soutien de Cityway et d’Île-de-France Mobilités, dans le cadre du projet m2i.

logo idfm
logo cityway

Vous souhaitez connaître la qualité des données OpenStreetMap sur votre territoire ? Elles peuvent sûrement enrichir vos propres données et améliorer l’information voyageurs.

Contactez-nous, c’est notre expertise.


Licence photo « Bus à Montmartre » CC-By Chris Waits

Audit Île-de-France – Mise à jour de novembre

Jungle Bus présente un nouvel audit comparatif des données de transport d’Île-de-France.

Dans ce document, notre équipe constate la progression de la cartographie du réseau de bus dans OpenStreetMap et se focalise en particulier sur les arrêts situés autour des gares Transilien du RER C qui ont fait l’objet d’une cartographie exhaustive.

Ce document fait suite à la deux premières versions de l’audit : publiée en avril 2018 puis celle publiée en juillet 2018.