Fiche d'infos et guides

GUIDE: Initiation au journalisme de données

Par Adi Eyal et Raymond Joseph

Il n’y a pas de journaliste de données. Mais il y a toutefois des journalistes qui travaillent sur les données.

Les fondamentaux du journalisme n’ont pas changé avec l’introduction des données, des analyses et de la visualisation interactive. De même, les éléments de base de la profession (rechercher, reporter et disséminer des informations) restent intacts.

C’est quoi le journalisme de données?

Le journalisme renvoie à un nouvel ensemble d’outils qui peuvent aider les journalistes à travailler avec une masse importante d’informations, à creuser davantage et à mieux communiquer.

Il s’agit en réalité d’un vieux concept sous une nouvelle appellation. Le journalisme assisté par ordinateur, son ancien nom, implique l’utilisation d’ordinateurs pour analyser une masse importante d’informations en recherchant et en ordonnant les informations contenues dans des bases de données.

Comme le nombre de documents dont nous disposons augmente, il devient impossible de les lire chacun individuellement. Les ordinateurs dépassent l’homme quand il s’agit de traiter les choses rapidement. Cela devient même plus évident quand vous regardez des milliers de chiffres, comme la valeur des toutes les marchés publics du gouvernement sud-africain ou les statistiques de chaque commissariat de police sur la criminalité : un cerveau traitant 330.000 clonnes de nombres dans toutes les catégories de crime à travers l’Afrique du Sud depuis 2004.

De manière conceptuelle, le procédé du journalisme de données peut être considéré comme un ensemble d’étapes par lesquelles il faut passer pour transformer les chiffres en idées. Il comprend quatre parties :

  • acquisition
  • nettoyage
  • analyse et
  • narration

Vous n’avez pas besoin de passer par chacune de ces quatre étapes pour chaque article, mais cette approche est nécessaire.

Nous allons analyser chaque étape. Remarque: Vous aurez besoin de faire usage de votre intelligence. Mais vous n’avez pas besoin par contre d’apprendre à programmer un ordinateur pour apprendre le journalisme de données, à moins que vous ne voiliez le faire. Autrement dit, vil n’est pas nécessaire d’être un mécanicien pour conduire une voiture.

Le meilleur journalisme de données est le fruit d’un travail de groupe entre un journaliste et un codeur ou superviseur de données.

1. L’acquisition

Au cœur du journalisme de données se trouve un ensemble croustillant de données. Les bons exemples pourraient être les salaires des élus, les statistiques nationales sur le crime ou même les causes de décès en Afrique du Sud. Même les données vraisemblablement ennuyantes, comme les recettes tirées des contraventions par municipalité, ont des histoires intéressantes à raconter.

Donc où trouver ces données? En tant que journaliste de données, vous aurez besoin de créer votre propre liste de sources de données. En Afrique du Sud, il y a quelques endroits tout indiqués qu’il faut d’abord consulter : Statistics South Africa, la Commission électorale indépendante et le Trésor disposent d’une collection enviable de données.

En regardant un peu plus loin, les portails de données de la Banque mondiale et l’ONU sont très utiles. Des séries de données sont également dispersées sur les sites gouvernementaux en Afrique du Sud. La mairie du Cap a lancé son propre site de données accessibles et Code for South Africa (Code4SA) contient une niche de données qui sont inhabituelles ou difficiles à trouver.

Malheureusement, ce n’est pas toujours facile de télécharger un document de l’Internet. Les données sont le plus souvent publiées dans des formats non convenables et qu’il faut extraire les données du site web. (NB : Le chapitre ‘’Obtenir des données’’ du Livret sur le journalisme de données fournit un aperçu sur la procédure. Utilisez ce support pédagogique offert par l’Ecole de données, qui assure également une formation d’excellente qualité sur le journalisme de données).

Si tout cela ne marche pas et que vous ne pouvez pas mettre la main sur les données qui, pourtant, existent en Afrique du Sud, vous pouvez recourir à la Loi sur la promotion de l’accès à l’information (PAIA). Mais cela ne devrait pas être votre premier recours, étant donné que cela peut être coûteux et vous prendre trop de temps. Mais ça vaut la peine de tenter, si votre requête est classée sans suite.

La South Africa History Archive offre un service destiné à aider les organisations, les chercheurs, les journalistes et les individus à soumettre des requêtes dans le cadre du PAIA.

2. Le nettoyage

Maintenant que vous avez votre ensemble de données, il peut être ‘’sale’’ et pas du tout prêt à dévoiler ses secrets. Un exemple typique peut être la mauvaise orthographe d’un lieu, comme ‘Rosebank’ vs. ‘Rosbank’.

Malheureusement, c’est à ce niveau où vous aurez besoin de vous retrousser les manches et de bien nettoyer les données en corrigeant les fautes d’orthographe, en supprimant les caractères inutiles et en rendant les données plus présentables. Si vous le faites pas, vos résultats vont probablement en pâtir.

C’est la partie la moins élégante lorsque l’on travaille sur les données. Et cela prend généralement le plus de temps – environ 80% de la durée totale du projet.

Il y a plusieurs façons de la faire. Votre feuille de calcul est une bonne chose pour démarrer. Des données plus complexes peuvent demander quelque chose de plus lourd. Open Refine est un excellent outil et votre dernier arrêt avant d’avoir besoin d’apprendre comment coder.

3. L’analyse

Maintenant vous avez un ensemble propre de données, ou bien aussi propre que possible, entre les mains. C’est là où le côté amusant – le véritable journalisme – entre en action.

L’outil le plus important réside dans votre propre curiosité and votre flair journalistique de l’information. Des faits intéressants, des anecdotes inhabituelles et des histoires fascinantes peuvent être trouvés à l’intérieur des ensembles de données, mais malheureusement ils se cachent dans un méli-mélo de chiffres.

Pour faire ressortir les informations, il faut interroger les données. Quelle la valeur de tous les marchés publics en 2014 ? Combien d’offres individuelles y avait-il ? Quelles compagnies ont gagné le plus de marchés ? Plus vous posez de questions, plus et mieux les réponses deviennent spécifiques, jusqu’à ce que vous appreniez finalement quelque chose d’inattendu.

Vous pouvez trouver beaucoup d’outils qui peuvent vous aider dans votre analyse mais Exel est de loin le meilleur.

4. La narration

Maintenant vous en êtes là où nous voulions commencer. Vous avez découvert quelque chose d’intéressant dans les données et vous êtes prêt à le raconter au monde.

Attendez un peu

Quels que soient les outils que vous utilisez pour chercher des informations, vous ferez le travail de journaliste. Vous devez procéder à la vérification nécessaire, parler aux experts et de faire toute autre chose nécessaire comme dans n’importe quelle autre affaire. Vous devez également traiter les données et les découvertes avec le scepticisme qu’il faut et vérifier votre travail. Attention aux données – elles peuvent être trompeuses, ou même mensongères.

Il faut trouver la façon adéquate de narrer votre information. Et, parce que les lecteurs n’aiment pas être confrontés à une série de chiffres, vous devez les présenter de manière à ce qu’ils soient faciles à digérer.

Dans beaucoup de cas, il est utile de visualiser vos découvertes en utilisant des graphiques et d’autres supports visuels. Si vous publiez en ligne, vous pourriez même aller plus loin et créer des outils interactifs pour attirer vos lecteurs vers les données.

Il est cependant facile de se perdre. Vous pouvez vous perdre en créant une belle visualisation et oublier totalement pourquoi vous avez fait tout ce travail à la base.

Les graphiques ne sont pas l’information, mais sont là pour la renforcer et aider les lecteurs à mieux comprendre ce que vous dites. Très souvent, les graphiques deviennent l’information. Pendant que votre article est partagé sur les réseaux sociaux, les lecteurs peuvent ne regarder que votre graphique et ignorer complètement votre texte.

Quelques outils gratuits de visualisation de données:

Un plus pour la trousse d’outils journalistiques

Le journalisme de données est un outil supplémentaire et passionnant au journalisme standard, et qui évolue de manière rapide. Il peut sembler intimant, au début, surtout quand l’idée d’ouvrir une feuille de calcul vous rend inconfortable.

Heureusement, beaucoup d’outils ont été mis en place pour rendre le travail sur les données beaucoup plus accessible. Pour démarrer, cette fiche d’information contient des outils que vous pouvez utiliser pour jeter à l’eau.

Adi Eyal est le fondateur et directeur Code4SA. Ray Joseph est un journaliste freelance, formateur en journalisme et consultant en média.

Traduit de l’anglais par Assane Diagne

© Copyright Africa Check 2015. Vous pouvez reproduire cet article totalement ou partiellement dans le cadre d’un reportage et /ou d’une discussion sur l’information et l’actualité, à condition d’en attribuer le crédit à “Africa Check, une organisation non partisane qui encourage la précision dans le débat public et dans les médias. Twitter @AfricaCheck_FR et fr.africacheck.org".