Les données massives ou big data font l’objet d’une forte attention des médias, de la recherche et des entreprises. Les big data seraient notamment l’occasion d’un renouvellement épistémologique sans précédent (Bell et al., 2009), lequel ouvrirait la voie à des manières nouvelles de connaître le monde et de l’organiser. Chaque secteur d’activité serait touché.
Le journalisme n’échappe pas à cette règle d’autant que la montée en puissance de la thématique des big data dans l’espace public est concomitante de l’émergence de pratiques nouvelles connues sous le nom de data journalisme. Les big data promettent la révélation de vérités jusqu’alors insaisissables. Le data journalisme en fait de même. Grâce à des procédés nouveaux de data visualisation, il ambitionne de donner à voir ce qui jusqu’ici échappait au regard acéré du journaliste.
Pourtant, promoteurs des big data et du data journalisme semblent mobiliser des représentations épistémologiques irréconciliables. Quand les premiers font du critère d’efficacité une preuve en dernier recours, le data journaliste s’impose un ensemble de règles qui l’astreignent à une démarche empirique des plus classiques. Data journalisme et « science des big data », s’ils proposent de saisir le réel à travers les données, ne sauraient donc être confondus. Le chercheur en journalisme se doit de les distinguer pour mieux identifier ce qui fait la spécificité du journalisme de données.
Nous nous proposons ici d’interroger ces représentations épistémologiques irréconciliables en explorant les discours d’accompagnement de leurs premiers promoteurs…