Redéfinir l’open data pour libérer tout son potentiel
L’open data consiste à donner accès avec un usage libre à des données numériques.
Ces données sont diffusées de manière structurée selon une méthode et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière. Ce n’est pas GreenSI qui le dit, mais Wikipédia, et donc toute la communauté qui supporte l’open data en France.
Cette définition capture toute la philosophie qui anime ce mouvement open data depuis 2010. Mais huit ans plus tard (une génération en informatique), les restrictions techniques n’existent plus dans les infrastructures modernes à base d’API et de micro-services, le Cloud permet le partage et l’interopérabilité à l’échelle mondiale, et les collectivités comme les entreprises, cherchent de nouveaux modèles économiques pour valoriser leurs données avec en perspective le développement de l’intelligence artificielle.
Alors GreenSI pose la question dans ce billet : n’est-il pas temps d’ouvrir le champ de cette définition qui imagine un monde idéal de réutilisation libre des données ?
D’ailleurs quels résultats cet open data revendique t-il après huit ans d’investissements dans une plateforme nationale (data.gouv) et de multiples initiatives locales ?
On peut certainement dire que sur le plan de sa reconnaissance, c’est gagné pour l’open data. Les licences de mise à disposition sont réellement utilisées et puis l’open data est même passé dans la loi pour les communes de plus de 35.000 habitants, même si la loi amène autant d’inconvénients par la contrainte et l’encadrement que d’avantages par la stimulation du lancement des projets. Des programmes open data ont donc été lancés dans toutes les métropoles et même des villes moyennes se sont engagées dans cette voie.
En revanche, sur le plan de son impact économique réel, l’open data n’a certainement pas encore atteint son plein potentiel. Selon l’association Opendata France, 219 collectivités locales ont ouvert leurs données sur… 4400 au moins de concernées. Pourtant le monde se digitalise à grande vitesse et 90% des données ont été créées deux années précédentes. Ce ne sont donc pas les données qui manquent et le besoin d’information dans le tourisme ou le transport est réel mais passe souvent… par une plateforme des GAFAs. Les données ouvertes restent encore marginales dans cet océan de données et surtout la croissance des ouvertures, une fois les portails lancés, reste très inférieure à la croissance des données dans le monde. GreenSI se demande donc si ce n’est pas une illusion et que de nombreuses données sont ouvertes et circulent, mais pas via les programmes open data officiels.
En conclusion de cette première analyse, l’open data en France reste donc aujourd’hui une démarche transverse de transformation numérique des collectivités locales, dont la partie émergée de l’iceberg est un portail et des données ouvertes. Toute la valeur s’est libérée en amont dans cette démarche d’acculturation des agents aux données et de gouvernance de la donnée territoriale, incluant depuis peu le traitement des données personnelles depuis le RGPD. Mais en bout de chaîne, peu de valeur est tirée des portails ouverts et des données réutilisables.
Un benchmark récent de l’open data des métropoles montre que les données les plus téléchargées, et peut-être les plus réutilisées (mais on n’en sait rien par la définition de la liberté d’usage, ou pas, de l’open data), sont celles qui ont trait à la mobilité au sens large (GTFS, places de stationnement, vélos en libre service …). Allons explorer un peu les échanges dans ce domaine.
Quand on s’intéresse aux échanges de données et aux plateformes dans le transport comme GreenSI, on est certainement allé explorer le programme « Connected Citizens » de Google et sa plateforme d’échange de données trafic temps réel Waze ouverte aux villes. Les données des utilisateurs de Waze sont anonymisées et transmises aux cellules de pilotage des villes qui en échange fournissent les informations sur les travaux et les perturbations.
Jusqu’à présent, les données étaient disponibles via la plateforme dédiée de Waze et non pas en temps réel. Mais la semaine dernière a été annoncé un partenariat entre Waze et Esri, la solution de système d’information géographique la plus utilisée par les collectivités, avec la disponibilité des données de Waze en temps réel dans l’application ArcGIS Online d’Esri.
Une ville comme Boston l’utilise pour avoir un aperçu des lieux dangereux ou à congestions fréquentes pour organiser une planification urbaine optimisée. Maintenant elle a un tableau de bord en ligne temps réel de ces événements. L’impact de ces données se chiffre en centaines de milliers de dollars économisés sur ces usages, qui auraient été dépensés en capteurs et collecte de données. Les données ont déjà été set utilisées par Waze pour offrir son service à sa communauté et sont ici réutilisées par une ville. Ouverture, réutilisation, pourtant, ce n’est pas de l’open data selon la définition de Wikipedia. Et d’ailleurs une seule métropole française s’est engagée dans ce programme qui rassemble des dizaines de grandes villes dans le monde. Bizarre.
Ce n’est pas de l’open data car ce n’est pas l’ouverture des données de Waze (qui d’ailleurs n’y est pas contraint par la loi), car c’est l’adhésion (gratuite) à un programme et un échange de données organisé dans les deux sens. Certains disent cependant que c’est à l’avantage de Waze qui garde mondialement des droits d’exploitation sur ces données quand le partenaire ne peut prétendre qu’à des droits limités au territoire sur lequel il apporte ses données.
Plus près de chez nous, la plateforme de données multimodale Navitia de Kizio Digital (groupe Kéolis), collecte toutes les données de transport et calcule des temps de trajet entre deux points à ceux qui accèdent à son API. Une société immobilière peut ainsi, moyennant rémunération, proposer le service à ses clients de trier ses petites annonces par distance pour aller au travail, ou un service de train peut également proposer des services de mobilité une fois arrivé en gare. Mais ce n’est toujours pas de l’open data.
Au Royaume Unis les pouvoir publics ont fermé fin 2014, après 10 ans de bon et loyaux services, le site public d’open data, Transport Direct, de calcul d’itinéraire qu’ils géraient. Ils ont reconnu qu’il n’était plus assez performant par rapport aux offres du privé qui s’étaient développées. C’est donc bien l’organisation globale des échanges qui a de la valeur et moins de savoir si c’est un serveur public ou privé qui la délivre. Le pragmatisme bien anglo-saxon que nos clochers ont parfois du mal à capter.
En Chine c’est l’acteur privé Ofo, les vélos en libre service jaunes à Paris, qui a annoncé ouvrir ses données à 200 villes chinoises pour qu’elles puissent mieux gérer la circulation.
Donc dans le domaine des transports – le plus avancé en open data – le constat semble donc que huit ans après l’open data tel que défini dans Wikipédia, celui-ci se développe et produit les jeux de données les plus téléchargés sur les portails, mais sans grands résultats économiques. En revanche, des plateformes de données ouvertes selon des modalités qui ne relèvent pas de l’open data amènent des résultats économiques d’optimisation dont les villes bénéficient. Et l’international fait aussi évoluer son modèle. Il existe donc un autre open data, peut-être celui vu par les entreprises et moins par le service public.
Est-ce que ce sont deux approches de l’open data concurrentes ou complémentaires ?
Ce billet a démarré sur Twitter quand des acteurs engagés depuis longtemps dans l’open data public refusaient que l’on puisse utiliser le mot « ouvert » pour un service d’API sur lequel il faut obligatoirement un compte pour s’y connecter comme sur Navitia et Waze.
Ce compte et son enregistrement sont vus comme une restriction technique, empêchant la libre réutilisation des données fournies par l’API. Ainsi est donc écarté du champ de l’open data l’ensemble des APIs que les entreprises commencent à ouvrir pour répondre à une économie numérique de plus en plus interconnectée.
Dommage pourtant de ne pas avoir cette perspective dans le champ de l’open data si in fine elle délivre de vrais services aux citoyens.
Et puis de nouvelles contraintes de sécurité, comme celle du RGPD, font que la plateforme intermédiaire doit authentifier les utilisateurs pour vérifier qu’ils ont bien les droits d’accéder à cette donnée personnelle pour l’usage qu’ils veulent en faire. L’ouverture a priori de données anonymisées pour des usages libres, comme le définit l’open data, va devenir de plus en plus compliqué voire totalement interdit. A moins que la technique et notamment l’authentification par un tiers, des usages et des ré-utilisateurs, ne vole au secours d’un open data qui ne pouvait imaginer dix ans à l’avance cette règlementation.
Enfin dans les nouveaux projets Smart City, les villes engagées dans leur transformation numérique, il ressort une tendance majeure en 2018 : la recherche d’un modèle économique. Le numérique doit amener des économies (efficacité énergétique, réduction des temps de transport, de la pollution…) et développer des opportunités de création de valeur (développer l’emploi) sinon son financement récurrent n’est pas assuré. C’est ainsi que de nombreux projets n’ont pas quitté l’étape de démonstrateur après la fin de la subvention initiale.
Or il s’avère que la libre circulation des données est au cœur de l’efficacité des smart cities, et que justement cette libre circulation doit s’organiser, se sécuriser et se valoriser. L’open data doit y contribuer mais ne couvre pas toutes les alliances d’échanges qui s’organisent.
L’étude du cabinet McKinsey, datant de 2013, « Open data: unlocking innovation and performance with liquid information » le mettait déjà en avant sur la base du retour d’expérience de l’open data anglo-saxon qui a démarré plus tôt qu’en France. Le bénéfice était estimé à $3000 milliards de gains en efficacité par une meilleure accessibilité à l’information à un coût inférieur, y compris gratuit quand c’est une donnée publique. Dans les transports c’est presque un tiers de ce montant que l’on peut aller chercher en améliorant l’information des planificateurs, gestionnaires et des usagers des routes et services de mobilité.
Liquide : et si c’était ça la définition de l’open data ? Quand la donnée peut circuler, comme entre Waze et sa communauté, entre sa plateforme et le SIG de la ville de Boston, entre la ville de Boston et ses opérateurs de services.
Une définition qui mettrait en avant un objectif et non des moyens ou une limite de moyens.
GreenSI est donc convaincu que l’open data est bien ce moteur des projets de Smart City.
Mais pour cela l’open data va devoir revoir sa définition, y ajouter l’économie des plateformes, publiques comme privée, étendre ses licences pour intégrer les entreprises et même permettre aux collectivités qui vont coordonner ces échanges de pouvoir les financer alors que de se rémunérer est actuellement interdit par la loi quand les GAFAs ont eux peu de barrières pour en tirer profit.
L’open data va fêter ses 10 ans.
Le plus beau cadeau qu’on pourrait lui faire serait peut-être de lui offrir les atours pour embrasser plus largement les échanges de données entre acteurs dans une économie réellement numérique, de prendre en compte dix ans d’évolution des plateformes et de quitter son focus sur la sphère publique.