Retour sur la formation Datajournalism et Traitement des données

Les vendredi 26 et samedi 27 octobre 2012, l’association Libertic accueillait  à la cantine numérique nantaise et avec le soutien de Nantes Métropole, Caroline Goulard de Dataveyes afin d’initier une vingtaine de participants aux principes de datajournalism et traitement de données.

Cette formation avait notamment pour objectif de répondre aux questions suivantes : Qu’est-ce que le datajournalism ? Comment extraire une donnée ? Comment créer une visualisation à partir de données ? Avec quels outils ? Et bien plus encore… voir le support de la présentation ci-bas.

Ces deux jours ont été l’occasion pour les participants de monter en compétence sur le traitement des données de manière conviviale et ludique. Des groupes de travail ont été constitués afin de mettre en pratique les connaissances acquises durant la partie théorique. Parmi les travaux réalisés sur l’outil infogr.am : Combien d’années de travail pour s’acheter une maison selon les régions ? Quel temps passé dans les embouteillages selon les agglomérations ? Ou encore : Quelle répartition des investissements du Conseil Général de Loire-Atlantique ? Le résultat en infographies dynamiques.





Les retours de Caroline Goulard ont ensuite permis d’identifier les points d’amélioration de chaque projet, démontrant que la visualisation n’est pas seulement un défi d’appropriation des outils mais également une science de la représentation. Les participants se sont montrés enthousiastes et ont affirmé la nécessité d’une diffusion de l’information autour de ces nouvelles pratiques encore méconnues, y compris au sein des rédactions. Du côté des journalistes, de nombreuses questions persistent : Comment intégrer le Datajournalism au sein d’une rédaction ? Comment financer l’investissement humain nécessaire à ces productions ? Quelle valorisation pour les modèles économiques ? Mais un constat partagé de la nécessité d’appropriation du sujet. Pour voir la formation d’un point de vue participant, consulter ce Pearltree.

De nouvelles données ouvertes sont publiées régulièrement en ligne, mais pour développer leur réutilisation il convient de favoriser l’alphabétisation du public, ce qui impliquerait des cycles continus d’ateliers afin de former les nouveaux entrants aux outils. Les difficultés d’appropriation de « simples » tableurs représentent d’ailleurs une première entrave à la réutilisation des données. Un chantier éducatif serait nécessaire pour intégrer cette nouvelle culture.

Un Hackathon sur la réutilisation des données ouvertes aura lieu les 15 et 16 décembre sur Nantes afin de mettre en pratique ces connaissances. Pour réviser ou développer d’autres techniques, n’hésitez pas à consulter la boîte à outils de traitement de données de la Fonderie.

 

Share
Posted in Evènements, Journalisme de données, Projets | Tagged , , , , , , , , | Leave a comment

Validons le cahier des charges pour l’ouverture des données évènementielles !

 

Le 27 juin dernier, Stéréolux et Libertic conviaient les structures nantaises intéressées par le projet d’ouverture des données évènementielles (« ODE ») à une présentation du cahier des charges d’un agrégateur de données. Voir le compte rendu de cette dernière rencontre.

Pour rappel, le projet « ODE » part du constat suivant :
Il y a aujourd’hui un réel problème de circulation des informations entre producteurs et
réutilisateurs de données. Il existe une gestion individuelle des données, sous des formats et
structurations diverses qui pénalisent l’interopérabilité et la diffusion d’informations, notamment sur le secteur évènementiel avec la gestion d’agendas et de lieux de référencements d’évènements multiples et variés.

Les producteurs d’évènements doivent faire face à de lourdes actions de communication, énergivores et chronophages, avec des coûts humains et financiers. Pour les réutilisateurs, la disparité des données pénalise l’appropriation et donc la valorisation de l’information.

 

Solution proposée
Des différentes réunions a émergé le projet d’ouverture des données évènementielles sur le
territoire. Il s’agit d’un projet collectif de développement d’un agrégateur de données évènementielles permettant de collecter automatique les données ouvertes. Le projet réunit organisateurs d’évènements, réutilisateurs de données évènementielles, medias et différentes collectivités. Il est actuellement piloté par Stereolux et Libertic avec l’implication de Makina Corpus en concertation avec tous les acteurs investis dans la démarche.

 

Les étapes du projet

Le cahier des charges est donc désormais soumis à contributions: proposez vos réflexions ! Accéder au cahier des charges.

 

Une liste de diffusion a été créée pour le projet d’ouverture des données événementielles. Si vous souhaitez vous y inscrire, vous pouvez envoyer un email à ode@stereolux.org afin de recevoir toutes les actualités et rejoindre le projet en tant que diffuseur ou utilisateur de données évènementielles. Ce projet collectif est ouvert à tous, sans restriction de statut ou géolocalisation, rejoignez-nous !

 

 

Share
Posted in Projets | Tagged , , , , , , , , , | Leave a comment

Pourquoi la TAN ne méritait pas le procès qui lui a été fait

La semaine dernière, Entreprenantes publiait un article intitulé : la TAN fait faux bond aux développeurs, des applications en danger.

L’article revenait sur les problématiques de qualité des données et de leur mise à disposition et mettant en doute l’implication de la TAN dans l’open data, faisant ainsi écho au ressenti des développeurs notamment du fait que les responsables de la TAN n’avaient pas participé à la rencontre sur les problématiques autour de leurs données. Cet article a ensuite été repris dans Presse-Océan sans qu’aucun recoupement ou vérification n’ait été faite.

 

Aujourd’hui, une réunion ouverte avec le Président, le Directeur et le Directeur Commercial de la Semitan ainsi que des développeurs a permis d’éclaircir les raisons de cette absence à la rencontre avec les développeurs, et nous y avons découvert que cette responsabilité nous incombe !

 

Retour sur la chronologie des évènements :

 

  • Novembre 2011 : Lancement du site data.nantes.fr

Mise à disposition des données par la TAN. Première version plutôt complète et compréhensible malgré des points manquants, telles les directions de lignes et les points de transferts.

 

  • Février 2012 : Mise à jour des nouvelles données de la TAN

Le nombre d’horaires aux arrêts a été multiplié par 3, passant de 600 000 horaires à 1 500 000 horaires. Le nombre de ligne disponibles dans le nouveau jeu a été à la baisse, les données ont beaucoup changé pour une simple mise à jour. Les identifiants de ligne, arrêts et autres objets étaient changés, les développeurs sont obligés de mettre complètement à jour leurs applications où rester sur l’ancien jeu de données. Certaines questions restaient sans réponse sur le forum de data.nantes.fr

 

  • 19 juin 2012 : Rencontre entre la ville et les réutilisateurs de données

Face aux questionnements des réutilisateurs de données de la TAN, il est décidé d’organiser une rencontre spécifique au sujet.

 

  • 9 juillet 2012 : Rencontre sur l’usage des données de la TAN

Les réutilisateurs de données, Nantes Métropole et la Tan étaient conviés. Un représentant avait validé sa participation. Pourtant la réunion s’est déroulée uniquement entre développeurs et Nantes, aucun représentant de la TAN n’étant représenté.

 

Le même jour (soit quelques jours seulement avant le changement officiel des horaires de la TAN), un nouveau jeu de données avec les horaires d’été de la TAN était mis à disposition en prenant en compte les retours des développeurs.

 

  • Entre le 11 et 13 Juillet : Echanges de mails entre la TAN et les développeurs

Le représentant de la TAN indique qu’il n’a pas reçu d’invitation à la réunion. Il demande les retours des développeurs. Une analyse des problématiques lui est transmise. Le représentant indique qu’il en fait part dès lundi en interne pour avancer.

 

  • Dimanche 15 juillet : Les services qui n’étaient pas branchés sur data.nantes.fr tombent

Certains développeurs n’étaient pas encore branchés aux données sur data.nantes.fr mais récupéraient les flux sur directement sur la TAN. Celle-ci avait leur indiqué que ce service allait fermer et qu’il fallait désormais utiliser data.nantes. Du fait de la mauvaise documentation des API de la TAN, ce passage s’est révélé compliqué, provoquant le tweet suivant interpellant la TAN sur sa responsabilité (sic) quant à la défaillances des services. Et mettant en lien l’article déjà obsolète sur la question de la mise à disposition des données.

 

  • Lundi 16 juillet : Invitation de la TAN à une rencontre avec les développeurs

 

  • Mercredi 18 juillet : Rencontre entre la TAN, les développeurs et Nantes Métropole

Une réunion plus politique que technique, où la TAN exprimait son incompréhension sur le procès qui lui était fait. A leurs yeux, ils jouaient parfaitement le jeu de l’open data. Pour preuve :

  1. Ils mettent leurs données à disposition
  2. Ils ont financé une partie de l’appel à projets open data pour récompenser la réutilisation
  3. Ils ont une approche ouverte avec les réutilisateurs, allant jusqu’à tolérer l’usage du nom TAN sur l’application pourtant en obsolescence simpletan.fr
  4. Ils organisent une rencontre pour mieux prendre en compte les retours des utilisateurs

Un travail sur la documentation devrait être fourni et il est envisagé des rencontres régulières avant chaque mise à jour de données.

 

D’où vient le problème ?

 

L’article d’Entreprenantes remettant en cause l’implication de la TAN se base notamment sur le fait qu’aucun représentant n’ait participé à la rencontre du 9 juillet avec les réutilisateurs. Nous avons réalisé le 18 juillet que cette absence n’incombait pas du tout à la TAN mais résultait d’une incompréhension entre Libertic et Nantes Métropole. Nous avions demandé à Nantes de convier leur délégataire, qui a relayé et la TAN a rempli le sondage pour la définition d’une date. Mais nous n’avons pas envoyé l’invitation finale car nous relayons habituellement les informations auprès des réutilisateurs de données et sur les réseaux sociaux, sur lesquels ne sont pas forcément les délégataires avec lesquels nous ne sommes pas en relation rapprochée. De son côté, Nantes pensait logiquement que nous les avions conviés directement. Et voici comment cet amalgame s’est terminé en procès contre la TAN.

 

Et maintenant ?

 

Libertic organise depuis 2011 des rencontres entre la ville et les réutilisateurs et organise le relai d’informations auprès de la communauté de réutilisateurs de données. Cette pratique s’est mise en place car à l’époque du lancement du projet open data, Nantes n’avait pas les ressources et méthodologies pour animer la communauté. Depuis quelques mois, nous essayons d’organiser une transition dans l’animation et souhaitons que Nantes prenne désormais en charge l’animation directe de la communauté. Pourquoi ?

 

Nous avons constaté notamment avec le lancement de l’appel à projets que notre réseau reste assez limité et est orienté développeurs, indépendants plutôt que PME. Lorsque c’est Nantes qui assure la communication d’un projet, celle-ci touche un plus grand nombre de personnes. Or nous avons besoin d’étendre la communauté. De plus, il s’agit de la logique de l’open data que d’améliorer les relations entre l’administration et ses usagers à travers une communication directe, qui doit désormais se développer sans Libertic.

 

Nantes a bien un Community Manager sur le projet open data aujourd’hui. Mais la politique de communication de la ville en ligne l’empêche d’exercer son métier, à savoir gérer l’interaction en ligne ! Pour obtenir l’autorisation de répondre à une question en ligne, il faut faire valider la réponse en interne à plusieurs niveaux, éliminant toute possibilité de réactivité. Et lorsque des articles paraissent critiquant les initiatives de la ville (et sans que les journalistes ne pensent jamais à la contacter pour obtenir des réponses ou vérifier l’information), nous avons dû répondre nous-même pour ne pas laisser libre cours aux interprétations erronées. Aujourd’hui, les internautes nous interpellent en ligne lorsqu’ils ont des questions ou des problèmes avec le projet open data nantes. Parce qu’ils savent qu’ils auront une réponse et que c’est la moindre des choses que l’on puisse attendre d’une relation de confiance qui doit s’instaurer autour de la réutilisation des données.

 

Sauf qu’à passer par un tiers, celui-si se retrouve pris entre deux feux et la relation de confiance ne s’établit pas avec la ville mais avec Libertic. Nantes Métropole devrait donc considérer urgemment de développer enfin une stratégie de communication interactive en ligne afin de ne pas laisser à des tiers son travail relationnel, qui en l’occurrence a pu lui porter préjudice. Il s’agit de la seconde phase de l’open data : le développement de la participation et l’animation de la communauté, cela passe par une communication décomplexée, c’est à dire une communication 2.0 où nous aurions enfin quelqu’un au bout du fil.

De même pour la TAN, qui a eu la gentillesse de nous convier à une réunion d’explication, se refusant à s’expliquer en ligne afin « de ne pas alimenter la polémique ». Et laissant une fois de plus des tiers s’exprimer à sa place. Il va être difficile de maintenir le dialogue avec les réutilisateurs de données sans communication en ligne…

 

En conclusion, ce n’est pas la TAN qui est en cause sur le sujet (bien qu’il y ait encore de sérieux efforts à fournir sur la qualité des données et documentation mais c’est en cours), c’est un système de communication et de gestion de l’écosystème inadapté. Bientôt une nouvelle donne ?

Share
Posted in Projets | Tagged , , | Leave a comment

Compte rendu de la rencontre Open Data Ville-Acteurs du 19 juin

Régulièrement, la ville de Nantes, Nantes Métropole et les réutilisateurs des données de la plateforme data.nantes.fr se rencontrent pour échanger autour des difficultés rencontrées dans l’usage des données ou des attentes en matière de nouveaux jeux à mettre à disposition.
La dernière rencontre a réuni 14 personnes le mardi 19 juin, de 12h30 à 13h45 Tour de Bretagne.

 

 

Ordre du jour

Echanges entre les porteurs de projets, réutilisateurs de données et les services de Nantes Métropole pilotes du projet Open Data

1. Présentation des données à venir sur data.nantes.fr
2. Retour sur les demandes de données
- Focus sur les données budgétaires
- Mises à jour des données transports de la Semitan

Télécharger le support de la rencontre Ville_Acteurs_190612

Echanges

1. Présentation des données à venir sur data.nantes.fr

A l’ouverture de data.nantes.fr en novembre, il y avait 44 jeux de données sur la V1. Depuis, 7 jeux de données ont été rajoutés dont 4 nouveaux jeux mobilité.
Environ 90 jeux de données seront disponibles au total sur le site data.nantes.fr d’ici fin 2012.

Les nouveaux jeux de données suivent la même logique de priorité politique : environnement, tourisme et mobilité et correspondent à des évènements locaux: Nantes ville verte 2012 et Voyages à Nantes. Ces lignes directrices pourront être revues en 2013.

Question :
Les nouveaux jeux de données seront-ils statiques ou dynamiques ?
Réponse :
La V2 s’oriente vers davantage de flux temps réel mais le statique restera majoritaire au total.

La V2 est prévue pour fin 2012 . Elle inclura de nouvelles fonctionnalités tel que la notation participative des données et des outils intégrés de visualisation. La ville travaille avec Datapublica pour développer ces outils.

Exemples de données ouvertes au 2eme trimestre 2012 :
Naissances, décès, mariages, tarifs parkings, horaires, alertes info-trafic, aires de covoiturage, annuaires des associations, jours de collectes de déchets, etc.

Exemples de données prévue pour le 3eme trimestre :
Tarifs Bicloo, transports, tonnages déchets traités, catalogue bibliothèques, données budgétaires Nantes Métropole et ville : primitifs votés, annuaire des associations, salles de la ville, données de Voyage à Nantes (liste de brochures touristiques).

Voyage à Nantes va commencer à s’impliquer davantage dans l’open data. Le service a désormais un interlocuteur sur la question.
Pour les données Bicloo, une négociation est en cours avec Decaux pour obtenir les données de disponibilité des vélos en accès libre.
Pour l’annuaire des associations, il y aura plusieurs bases car il existe plusieurs sources de données et non pas un fichier global listant toutes les associations dans la ville.

Exemples de données prévues pour le 4eme trimestre :
Caméras de circulation, subventions des associations, tarifs des véhicules Marguerite, etc.

Question :
La liste des subventions aux associations, est-ce la liste des subventions accordées ou encaissées ?
Réponse :
A priori il s’agirait de la liste des subventions accordées, Nantes se renseigne sur l’existence éventuelle d’une liste de subventions encaissées.

Un travail est également en cours avec la SEVE (service environnement) pour diffuser les données de la biodiversité locale. L’état de circulation des ouvrages dans les bibliothèques (prêts, disponibilité) sera également disponible.

2. Retour sur les demandes de données

 

 

A/ Focus sur les données à caractère budgétaires

Suite à la demande formulée par le Club de la Presse, seront mis à disposition :
Le budget primitif et comptes administratifs (dépenses-recettes) depuis le début du mandat en 2008 et concernant la ville de Nantes ainsi que Nantes Métropole.
Il y aura également les budgets annexes, eau et assainissement.
Pour la granularité, les données seront présentées au niveau de l’article, en suivant les lignes du M14 (niveau indiqué comment étant le plus fin pour les institutionnels).
Un sérieux effort sur la documentation des jeux de données est mis en place pour expliquer chaque données. Elles seront disponibles en format tabulaire: csv, xls.

La proposition est fait aux autres communes/villes de l’agglomération de publier leur données sur la plateforme et d’avoir leur propre entrée si besoin. Sans leur implication, Nantes ne peut pas publier les budgets des autres communes.

En ce qui concerne les autres demandes du Club de la Presse :

Taxes d’habitation : la ville ne peut pas le faire pour les autres communes.
Le tableau d’amortissements et détail des emprunts validés, tarifs de l’eau et collecte des déchets seront mis en ligne, ainsi que le nombre d’agents en service avec une ventilation par direction.
La liste des parcs de véhicule, avec une publication synthèse par type de véhicule sera disponible.
La ville se renseigne concernant les demandes d’informations sur les chiffres et statistiques liés aux activités de la police municipale. Probablement une information disponible par le biais de l’INSEE.
La base de données des indicateurs de performance en matière d’environnement et transports publics ainsi que la consommation énergétique seront ouverts.

B/ Focus sur les données mobilité de la Semitan

Pour rappel, un résumé de la problématique par un développeur :

Après avoir attendu de nombreux jours, et après la sortie de l’application tan, et de l’api « temps réel », les données GTFS ne sont toujours pas à jour.
Certes l’api temps réel procure une plateforme « fiable » pour les développeurs, mais ceux qui comme beaucoup d’autres se sont basés sur le jeu GTFS au début, doivent encore attendre une mise à jour.
Une première version est sortie en Novembre, et était plutôt complète et compréhensible. Quelques points manquaient, telles les directions de lignes et les points de transferts.
Une autre version a été mise en ligne fin février, mais a apporté plus d’incompréhension que de réponses, la structure restant globalement la même, les identifiants de ligne, arrêts et autres objets étaient tous changés, obligeant les développeurs à mettre complètement à jour leur application où à rester sur l’ancien jeu de données.
Migrer vers ce nouveau jeu est risqué, car il y a des erreurs au niveau des horaires de tram/bus après minuit. De plus, à un niveau plus technique, les « identifiants de services » utilisés pour se référer aux « jours jaunes, roses, bleu et verts » sont au nombre de 1000, ne laissant que peu de chance aux développeurs de s’y retrouver convenablement.
Le nombre d’horaires aux arrêts a aussi été multiplié par 3, passant de 600 000 horaires à 1 500 000 horaires, créant beaucoup de doublons. Le nombre de ligne disponibles dans le nouveau jeu a aussi été à la baisse, les données ont beaucoup changé pour une simple mise à jour.
Beaucoup de choses qui nous font demander si la tan joue vraiment le jeu de l’open data !
A voir si ce problème vient d’eux ou de leur prestataire (apparemment ils délèguent la création du jeu GTFS) mais maintenir une application à jour après le 13 juillet, date de la fin du calendrier TAN, s’avère compliqué sans jeu GTFS, les applications basées dessus n’auront malheureusement plus aucune utilité.

Le dernier GTFS a été publié le 27 février. Les données sont valides jusqu’à l’été. Il y a des questions récurrentes sur le forum notamment sur la nouvelle version de la semitan qui pourrait être disponible fin juin

Au vu des questions et problématiques récurrentes sur le sujet, une rencontre entre les réutilisateurs des données de la Semitan, la ville/métropole et la Semitan est lancée. Ouverte à tous, elle permettra d’échanger sur cette question et d’envisager des solutions : Inscription ici

 

Pour participer aux prochaines rencontres villes acteurs, abonnez-vous à l’agenda de ce site !

Share
Posted in Projets | 1 Comment