Retour 1ère édition des Data & Business Day « villes intelligentes et durables »

Le jeudi 27 février 2020 se tenait la première édition des Data & Business Days, co-organisée par Cap Digital, le GFII, Syntec Numérique et la FNPS. Ce cycle de conférences a pour but de faire se rencontrer différents acteurs de la donnée travaillant dans le même secteur (la première édition portant ainsi sur la « ville intelligente et durable »).

En guise de propos liminaires, les organisateurs ont souligné que le secteur de la donnée est en pleine croissance et voit se développer sans cesse de nouveaux services, avant d’appeler à la mise en place d’une gouvernance et d’un cadre de collaboration autour de ce sujet, plutôt qu’à une recherche individuelle de contrôle et d’exclusivité.

A également été mise en exergue la nécessité de mener un travail de collaboration renforcé avec le secteur public, afin d’aider les collectivités et administrations menant leur transition vers l’open data à prendre le virage de la normalisation et de la stratégie de publication. En effet, comme le soulignera Jean-Marie Bourgogne d’OpenDataFrance, les acteurs publics soumis à l’obligation de publication gratuites de leurs données ont complètement occulté les autres possibilités de valorisation de celles-ci, à l’exception de quelques tentatives de centralisation via des portails et la création de poins d’accès nationaux thématiques.

Par la suite, les différents intervenants ont pu, pendant 8 minutes chacun, présenter les stratégies développées par leurs entitées autour des données qu’elles produisent ou collectent. Il ressort de ses présentations plusieurs axes sur lesquels nous voudrions revenir.

Un cadre légal dense autour du partage des données

L’encadrement juridique de la donnée a énormément évolué au cours des dernières années, sous l’impulsion de l’Union européenne, autour de deux principes forts : l’open data et la protection des données personnelles.

Le principe d’open data a été édicté pour les collectivités et administrations, ainsi que les entreprises délégataires de service public par la directive PSI 2, transposée en France par la loi pour une République numérique.

Cette transposition c’est accompagnée d’une véritable structuration de l’État :

  • avec la mise en place d’une politique d’acculturation à la donnée menée par Etalab d’une part ;
  • avec le déploiement d’une démarche agile et en « mode projet » portée par beta.gouv, qui vient apporter des réponses numériques aux difficultés rencontrées par les administrations.

Cette politique s’illustre par le déploiement des portails thématiques, tels geo.data.gouv.fr et transport.data.gouv.fr, qui accueillent les données des petites collectivités mais référencent également celles que les grandes entreprises mettent à disposition sur leurs propres portails.

Ce principe concerne également les entreprises des domaines de l’énergie et du transport de personnes, et donc au final énormément d’entreprises, dont plusieurs sont venues présenter leur stratégie lors du Data & Business Day.

Ainsi, la RATP, en attente des décrets d’application de la loi d’orientation des mobilités venue abroger la loi Macron sur les questions de mise à disposition des données, continue de fournir un accès à des API pour les données dynamiques, permettant une actualisation en temps réel de celles-ci, en recourant aux services d’opendatasoft, qui propose une plateforme SaaS permettant de partager et enrichir données pour faciliter leur partage et leur réutilisation.

Le second volet du cadre juridique de la donnée concerna la protection des données personnelles, considérablement renforcée avec l’adoption du RGPD, obligeant les entreprises traitant de telles données à revoir ou renforcer leurs protocoles afin d’assurer le niveau de protection requis. Ainsi, pour des acteurs tels qu’Enedis et Orange, qui mobilisent conjointement des données soumises à l’open data et des données personnelles pour fournir leurs services, le respect du RGPD est essentiel et implémenté dès les premières étapes de conception des services. Ainsi, Orange a mis en place un protocole d’anonymisation irréversible qui a fait l’objet de plusieurs audits, aucun n’ayant souligné d’anomalie.

La valorisation des données via le développement de services liés

A l’instar d’Enedis et Orange, il ressort de la plupart des présentations que les acteurs publics comme privés libérant leurs données valorisent ces dernières de trois façons :

  • D’abord en les structurant au sein de bases de données statiques
  • Ensuite en déployant des API (Application Programing Interface) permettant d’avoir un accès aux données actualisées en temps réel
  • Enfin en développant des services à partir des données qu’ils collectent ou produisent, et éventuellement des données tierces accessibles via ces API.

Ainsi, Enedis propose aujourd’hui 117 services, auxquels viendront bientôt s’ajouter 30 nouveaux, à destination de tous les publics, du consommateur final aux collectivités. Ces services sont ainsi rendus accessibles via différentes modalités (SMS, applications mobiles, portails, etc.) afin de répondre aux exigences de ces différents publics.

La Région Ile-de-France est un des acteurs publics ayant repris cette stratégie de la donnée, via la création d’IDF Smart Services, qui doit préfigurer le service public régional de la donnée. IDF Smart Service est ainsi co-construit par la Région et ses partenaires avec un quadruple objectif : une plateforme de services, un concentrateur de données, une coconstruction partenariale et un double numérique 3D du territoire.

La Région a déjà mis en ligne un service et doit en déployer deux autres dans les prochaines semaines et un quatrième d’ici quelques mois. Elle entend également progressivement accueillir les données d’intérêt général – c’est-à-dire produites ou détenues par des opérateurs privés mais dont la publication peut se justifier en raison de leur intérêt pour améliorer les politiques publiques.

Également, Airparif – en plus de mettre à disposition une dizaine de jeux de données liées à la qualité de l’air (polluants, émissions, etc.) – développe des cartes sur lesquelles peuvent être développées d’autres services (indice de qualité de l’air, etc.). L’organisation travaille également au développement d’API pour faciliter l’accès aux données, partagées selon les exigences de la directive INSPIRE.

Enfin, la Gazette des communes s’inscrit dans ce courant, en développant une activité de transformation de la donnée brute en outil d’aide à la prise de décision pour les collectivités.

Le choix de l’Open Database License

Plusieurs représentants ont souligné au cours de leur présentation le choix de leur organisation de partager les bases de données sous licence ODbL, qui impose un partage à l’identique les modifications qui y seraient apportées par des tiers, à l’image des licences copyleft pour les logiciels.

C’est notamment le cas de Airparif et de la RATP, et dans une moindre mesure de transport.data.gouv.fr puisque le portail utilise une licence ODbL à laquelle s’applique des conditions particulières. Il est ainsi précisé que la clause de partage à l’identique concerne les informations de même nature, de même granularité, de même conditions temporelles et de même emprise géographique. Par extension, seule est exigée le repartage aux bases de données dérivées pour les bases de données dérivées répondant à ces conditions.

La licence ODbL constitue un choix fort, qui peut préfigurer une volonté de structuration des acteurs de la donnée en écosystème organisé et collectivement administré. C’est en tout cas la logique qui a conduit OpenDataFrance a rédigée une FAQ relative à la licence, afin de faciliter l’adoption d’une interprétation commune de celle-ci parmi les utilisateurs français.