L’Open data, c’est maintenant !

L’Open data, c’est maintenant !

Un énorme enjeu politique, économique et citoyen

En un an, l’Open data est devenu une réalité en France. De quoi s’agit-il ? Où en est l’ouverture des données publiques, ici et ailleurs ? Quels sont ses apports pour l’Etat, mais aussi les entreprises et les citoyens ? Un premier colloque, «Open data La Conférence», organisé à Bercy le 27 septembre 2012, a permis d’y voir plus clair. A partir de ses interventions, point sur les tendances, les questions et attentes suscitées par ce mouvement de libération des données numériques sur la Toile.

L’Open data débarque

Initiée en Angleterre dès 2009, l’ouverture des données publiques (et privées) ou Open data a été officiellement enclenchée en France en 2011 avec le lancement de data.gouv.fr, un site qui propose déjà l’accès à plus de 3 500 «jeux de données» sur quantité de thématiques intéressant le quotidien des citoyens mais aussi les chercheurs et développeurs.

Ces datas sont issues d’administrations, d’agences d’Etat comme l’INSEE, AirParif ou Météo-France, de grandes entreprises comme la SNCF et EDF ou encore de collectivités locales. Elles sont traitées et mises gratuitement à disposition des internautes. N’est-il pas logique et légitime que chaque citoyen puisse savoir comment sont financés les travaux de voirie de sa rue, quel est le taux de criminalité de son quartier, quel est le niveau réel de pollution du littoral ou le salaire de ses élus ?

Un double enjeu de citoyenneté et de vie pratique

L’Open data est un enjeu majeur pour la démocratie et l’amorce pour l’Etat, détenteur de données et acteur principal de leur ouverture, de multiples perspectives. Il s’agit d’abord d’un enjeu de transparence, afin de répondre à la défiance des citoyens vis à vis du politique, suite aux trop fréquentes affaires de corruption. Une démarche éthique donc, qui permet aux administrés d’obtenir les informations auxquelles ils ont légitimement droit. Mais aussi une démarche pratique, une volonté de fonctionnement efficace afin que les citoyens puissent s’informer sur de multiples sujets de la vie courante.

Etalab, la «mission chargée du développement de la plateforme française Open data» instaurée par le précédent gouvernement, a ainsi lancé en mai dernier en partenariat avec Orange le programme Dataconnexions. Il vise à inciter à la réutilisation des données publiques et a primé six projets qui témoignent bien de ce double enjeu éthique et pratique.

Parmi ces projets, il y a effet Citizens, un tableau de bord pour mieux juger de l’action des gouvernements dans le monde, mais aussi Fourmisanté qui, grâce à l’accès aux bases de données médicales, permet à chacun de «se soigner près de chez lui et de mieux gérer son budget santé» ; ou encore Home’n’go, service gratuit pour mener sa recherche de logement.

L’originalité de cette start-up, explique Marc Ribes de Orange Business Service, «tient dans le fait de fournir des informations contextuelles liées à la localisation du bien.» Grâce aux données publiques utilisées, chacun peut «connaître les statistiques de prix au m², les données démographiques, mais également les établissements scolaires ou de santé à proximité, ainsi que la couleur politique de la commune


Evénement international dédié à l’Open data : en octobre 2011, à Varsovie, a eu lieu le second Open Government Data Camp. Il a réuni pas moins de 400 participants et 40 pays pendant deux jours.

Une ambition démocratique

Pour sa toute première édition, «Open Data La Conférence» a réuni le 27 septembre à Bercy une trentaine d’intervenants du monde entier, issus des administrations, des collectivités locales, de quelques grandes entreprises françaises et de divers groupements citoyens.

Si la transparence, intrinsèque à l’Open data, est clé, elle «n’est pas un objectif en soi» a expliqué le tout premier orateur Gilles Babinet – surnommé le «Digital Champion». Pour le fraichement nommé Monsieur Open data du gouvernement Hollande, en charge des relations entre la France et l’Union européenne pour les enjeux numériques, l’ouverture des données est surtout le moyen pour l’Etat de se réformer, de poursuivre sa décentralisation, d’aller vers une société ouverte et de redonner du pouvoir aux citoyens grâce à des échanges d’informations enfin pertinents et efficaces.

Grâce à l’Open data, les collectivités territoriales peuvent accéder aux données, jusqu’ici centralisées, nécessaires à la gestion des villes, départements et régions. Exemple : une municipalité qui fait un trou dans la chaussée ou construit un tramway dispose dorénavant de tous les plans de réseaux (gaz, électricité, fibre, etc.), égouts ou métro, mis en accès libre et gratuit par leurs gestionnaires et par l’Etat. Gilles Babinet a recensé plus de trente initiatives de ce type dans les régions.

L’idée force, que souhaite privilégier notre Champion digital, est de transcender les blocages. Là encore donnons deux exemples… L’accès aux données du parc locatif de logements permettrait de mieux gérer les besoins de constructions nouvelles, de cerner les disponibilités géographiquement cohérentes et de réduire le temps d’attente pour les demandeurs. Quant à l’ouverture des données de l’Assemblée nationale, elle mettrait fin aux interrogations actuelles sur l’usage des frais parlementaires.

Une nécessité : traiter les données avant de les libérer

Quelques-unes des expérimentations envisagées peuvent sembler plus problématiques, en raison de la nature des données concernées : comme la mise en ligne des CV confiés à Pôle Emploi, certes génératrice d’emplois potentiels mais éventuellement risquée en terme de protection de la vie privée. Ou la publication des résultats des élèves de primaire, des performances des écoles, des hôpitaux voire des praticiens. D’autant que, dixit Gilles Babinet, la CNIL semble «bien trop frileuse» sur ces sujets.

Autre condition sine qua non, il faut que les données mises en ligne soient traitées pour être compréhensibles par tout un chacun. Ce qui suppose des budgets importants, l’intervention de prestataires extérieurs, et pose la question de protection de l’intégrité des datas libérées. Toute manipulation, volontaire ou non, transformerait en effet la transparence en piège, et l’ouverture des données en un outil dangereux pour la démocratie.

En résumé, pour que l’Etat et ses administrés trouvent un réel bénéfice à l’Open data, tout sera question de financement, de dosage et de bonnes pratiques : intégrité et mises en forme simple des datas, exclusion ferme des données personnelles «sensibles», «anomymisation» systématique des données nominatives et traçage de ceux qui y accèdent via un identifiant unique, comme cela se pratique en Angleterre.


À quoi ressemble l’écosphère de l’Open data français ? En cliquant sur cette carte réalisée par Data Publica on peut voir les liens et les relations entre de nombreux sites français qui parlent d’Open data.

Le point de vue des entreprises

Parmi les intervenants du matin, Philippe Reynaud, directeur de la stratégie et des partenariats d’Orange Business Service, est venu donner la vision d’une grande entreprise pour qui les données comptent et sont au cœur de nouveaux marchés.

Orange, a-t-il expliqué, se place en «intermédiaire entre producteurs et utilisateurs de données». Son objectif est à la fois de valoriser ses compétences techniques en matière de réseaux d’échange, de gestion de Big data (masses de données) et de Cloud computing, et d’inventer de nouveaux services innovants. Pour lui, l’Etat est encore timide et l’offre n’est pas suffisante. «C’est le secteur public qui décide quelles données ouvrir, et il y a souvent peu ou pas de valeur au sens économique mais aussi social».

Autre écueil identifié, la qualité des datas. Elles ne doivent pas être statiques mais actualisables, et livrées dans des formats stables. Il faut aussi des données temps réel fiables, traitées et visualisées graphiquement et dynamiquement. Sa vision de l’Open data est celle d’un écosystème nourri par, et au service de trois partenaires : les opérateurs et fournisseurs de services, les administrations et les utilisateurs.

Dans le cadre du programme stratégique «Smart Cities», Orange Business Services a déjà développé quelques projets avec des collectivités locales. Comme la gestion de données temps réel issues de capteurs mesurant la qualité de l’air et de l’eau, le trafic routier ou encore les flux de transport.

L’exigence d’anonymat des données

Mais dès lors que les données sont nominatives, souligne Philippe Reynaud, elles doivent nécessairement être «anonymisées». Le département RSE (Responsabilite sociale de l’entreprise) de Orange est déjà très sensibilisé sur ce sujet et entend appliquer une politique claire et ferme en la matière.

Une exigence d’anonymat dont Orange a réalisé toute la portée, grâce à une opération montée avec sa filiale en Côte d’Ivoire. «La mise à la disposition de la communauté scientifique d’une base de données issues d’une année de communications de ses abonnés ivoiriens a nécessité un travail important pour rendre ces données anonymes», explique Valérie Peugeot des Orange Labs. L’usage de ce type d’informations par le gouvernement ou certains groupes politiques pourrait en effet s’avérer dangereux pour certains citoyens ivoiriens. Mais l’effort en vaut la peine, car il devrait permettre grâce au concours lancé «d’explorer des usages inédits des données comme anticiper des épidémies, être réactif en temps de crise, mesurer les signes avant coureurs et l’impact des sécheresses, etc.».


Quelles sont les grandes thématiques de l’Open Data en France ? Cliquez sur ce nuage de points et vous saurez.

Quand la SNCF se met à l’Open data

La SNCF entend elle aussi ouvrir la voie à des services innovants en libérant ses propres données. Le site data.sncf est en phase de tests et les usagers du rail auront très bientôt accès à des horaires complets et surtout régulièrement remis à jour. La SNCF prévoit quantités d’applications téléchargeables leur donnant en temps réel les retards, le quai de départ, la localisation des gares, un système  de visualisation du trafic national, etc., et la possibilité de faire remonter des informations. Gageons que la question, «pourquoi le train est-il immobilisé sans explication depuis deux heures ?» sera fréquente…

Ce que veulent les citoyens

L’après-midi de la conférence de Bercy, la parole a aussi été donnée aux citoyens. Et de leur côté, on l’imagine bien, la demande est forte. Ils attendent l’accès «aux données qui comptent» a rappelé le premier orateur Nigel Shadbolt, pionnier anglais de l’Open data. Ils veulent des services nouveaux et utiles au quotidien, mais aussi que l’Etat et les collectivités leur rendent des comptes et soient parfaitement transparents vis à vis des contribuables : quels sont les budgets, qui dépense quoi, qui contracte avec qui, qui touche combien, etc…

Une transparence qu’Agnès Verdier-Molinie, directrice de la Fondation IFRAP, un think-tank indépendant dédié à l’analyse des politiques publiques, appelle de ses vœux. Mais, a-t-elle expliqué, on n’en est pas encore là : «Nous devons encore demander (et parfois nous voir refuser) les données des administrations, du fisc ou des collectivités». Et de citer l’exemple incompréhensible de FourmiSanté, l’un des primés du programme Dataconnexions. Après mise en ligne de son comparateur pour choisir son médecin en fonction du tarif pratiqué, la jeune start-up a du provisoirement le retirer, la Caisse d’Assurance maladie l’ayant menacée de poursuites pour «concurrence illégale» et détournement de données.

Les citoyens aimeraient aussi qu’Open data se conjugue avec intelligence. Exemple explicite, donné par Georges-Etienne Faure, conseiller à la Mairie de Paris en charge des politiques numériques : «Chaque fois qu’un communiqué de presse est publié, on devrait également publier les données ouvertes correspondantes». Mais si l’organisme possesseur des datas s’y refuse, ont soulignés ces deux intervenants, il n’existe pour l’heure aucun mécanisme contraignant ni aucune loi l’y obligeant.

Plus tard dans l’après midi, Georges Nahon, vice-président d’Orange US en visio depuis San Francisco, a comparé les données publiques à un gisement de pétrole qui reste à explorer et exploiter, source d’innovations, de valeur, de réduction de la complexité et d’amélioration de la vie des gens.

Signe que la révolution est véritablement en marche, cette vidéo (en anglais), disponible sur le site de l’Open Gouvernement Data Camp en Pologne, émane de l’Open Knowledge Foundation.

Exemple typique de ce genre de carburant trop peu accessible à tous, évoqué par Pierre Murray-Rust, professeur à Cambridge et membre de l’Open Knowledge Foundation, les datas scientifiques, soumises dans leur majorité aux règles du droit d’auteur préempté par ceux qui les publient. «Nous sommes dans une guerre entre ceux qui veulent les ouvrir et ceux qui veulent les garder fermées pour faire du profit. Nous avons donc publié le «Panton Principle pour l’Open data» (Panton parce que tout a commencé au Panton Pub)» raconte cet anglais plein d’humour,  et développé un «logiciel de libération»». Objectif : rendre à la collectivité scientifique les résultats de la recherche publique, pour le plus grand bénéfice de ceux qui la financent avec leurs impôts. Tout un programme qui va prendre encore un peu de temps.

Mais jusqu’ici, hormis quelques bugs, mais on est en phase de rodage, tout va plutôt bien du côté de l’Open data !

Et pour aller plus loin

Commentaires