Dans le cadre du dossier L‘open data au service de l’analyse des flux, Sylvain Coppéré, Data manager Kisio Etudes & Conseil témoigne de l’expérience menée avec la ville de Caen.
Pourquoi un transporteur s’intéresse à la donnée GPS ?
Aujourd’hui la plupart des systèmes billettiques, à quelques exceptions près comme le RER en région parisienne, reposent sur une validation du titre de transport lors de l’accès au réseau mais pas en sortie. Autrement dit on ne peut pas déterminer avec cette seule donnée le parcours (origine-destination) des voyageurs. Il est nécessaire pour cela de recourir à d’autres données comme les enquêtes de mobilité réalisées par les collectivités. Avec pour inconvénient majeur d’avoir une photographie à un instant T mais pas de vision dynamique des flux, à l’échelle d’une journée ou de la semaine. La donnée GPS permet de pallier l’ensemble de ces inconvénients : on connait l’origine et la destination de porte à porte (et pas uniquement au sein d’un réseau de transport). De plus, la vitesse de déplacement et la trace nous permettent de déduire les modes de déplacement. On peut alors faire des études poussées sur les intermodalités.
Que vous a apporté l’expérimentation menée à Caen ?
A Caen nous avons utilisé l’application mobile de transport Twisto pour récupérer la géolocalisation des utilisateurs de l’application (sous réserve évidemment qu’ils acceptent de partager leurs géolocalisations). A partir de ces données, nous avons pu établir pour chaque ligne de bus les « serpents de charge », c’est-à-dire les flux entrée-sortie pour chaque arrêt. Une information très utile quand il s’agit de réfléchir à l’évolution d’un réseau de transport public, d’améliorer le cadencement ou encore de faire évoluer l’offre. Ce travail n’a pas été simple cependant : la donnée GPS doit être nettoyée pour éliminer les doublons et les aberrations comme le changement brutal de localisation d’un utilisateur. Elle est par ailleurs loin d’être parfaite : on perd l’utilisateur dans les tunnels ou lorsqu’il éteint son smartphone et on ne sait pas toujours, pour une vitesse constante, s’il marche ou utilise un vélo. Enfin et surtout il faut l’anonymiser car elle en dit long sur la vie de l’utilisateur. En ce sens nous cryptons les données et n’analysons et restituons que des statistiques de déplacement et non des déplacements uniques.
C’est une donnée à croiser avec des données en open data…
Oui tout à fait. Pour avoir une vision plus fine des déplacements à Caen, nous avons croisé les données GPS avec les tracés des réseaux de transport, des points d’intérêt qui aident à faire parler la donnée : une gare, un site touristique, une zone d’activité… De plus nous utilisons des données publiques de l’INSEE pour redresser nos informations. La donnée GPS en elle-même n’est pas signifiante, c’est par ces croisements de données qu’elle le devient. Quant à mettre en open data la donnée GPS « brute », c’est un sujet délicat eu égard aux obligations du RGPD. Les collectivités en revanche pourraient mettre en open-data des statistiques agrégées issues de ces données. On pourrait également faire en sorte que la majorité des applications de transport collectent cette donnée GPS avec l’accord de l’utilisateur. Car il est un peu étrange que les collectivités soient obligées de se tourner vers Waze ou Uber pour connaitre les pratiques de mobilité de leurs habitants…
Propos recueillis par Olivier Devillers, pour OpenDataFrance