1L’objectif de cet article est d’étudier le potentiel d’usage des classifications dans les dispositifs informationnels, aussi bien au niveau de l’accès, et de la navigation que de la catégorisation de l’information. On se focalisera sur les approches qui privilégient les folksonomies, les classifications à facettes et les techniques de visualisation. L’importance prise par les dispositifs d’accès à l’information pour le secteur marchand et culturel à travers la « centralité » des moteurs de recherche n’a pas dissipé les effets de mode ni les clarifications conceptuelles liées aux systèmes d’organisation des connaissances (Henneron et al., 2004). Les questions posées par l’usage des classifications ou de la possibilité de faire appel aux commentaires de l’usager ne sont pas nouvelles. Dès le xixe siècle, on se posait la question de la pertinence des catalogues systématiques par rapport à la rédaction d’un catalogue par ordre alphabétique (Vouillot, 2001). S’agissant des annotations, Dawanson imaginait dès 1964 (Su, 1994) un catalogue qui offrait des fonctions de recherche par similarité, la catégorisation des résultats trouvés et surtout la possibilité d’ajouter des commentaires (qu’on n’appelait pas encore tags) aux notices bibliographiques – commentaires-recommandations pouvant être soit privés soit partagés.
2Malgré leur intérêt pour la recherche d’information, les systèmes d’organisation des connaissances (listes d’autorité, thésaurus et classifications) présentent plusieurs insuffisances. Toute classification/catégorisation des connaissances constitue une suite de décisions d’ordre moral et/ou politique qui contribue à un moment donné à valoriser un point de vue et à faire le silence sur un autre (Lecomte, 2005). En cela les classifications sont l’expression d’un consensus établi dans des groupes dominants. Elles ne sont pas neutres ni objectives. Certains auteurs se posent à nouveau la question de l’utilité des classifications à l’heure de Google (Hjørland, 2012). Ce dernier voit des indices d’une crise dans l’usage accru des recherches par mot-clé et le désinvestissement de certains acteurs de l’industrie de l’information qui n’exploitent plus les classifications pour organiser leurs offres. Les utilisateurs trouvent les monographies dont ils ont besoin à travers le Web, singulièrement Google, au détriment du catalogue en ligne (Barton et Mak, 2012). C’est bien la captation de l’attention des utilisateurs qui est l’enjeu de la compétition-concurrence des institutions culturelles avec l’univers marchand (Augustine et Greene, 2002). Les usagers s’attendent à trouver dans les catalogues en ligne les fonctionnalités et services d’un portail commercial (moteurs de recherche, libraire en ligne, site d’e-commerce, etc.). Ces dispositifs amplifient les possibilités de navigation et de « sérendipité ». Ces nouvelles orientations permettent de dépasser le cadre étroit du paradigme de la requête et de considérer la recherche d’information comme une activité exploratoire.
La recherche d’information est exploratoire
3Le principal inconvénient dans une recherche d’information réside dans la formulation d’une requête. En effet, les performances attendues sont étroitement liées à la concordance entre le vocabulaire utilisé pour l’indexation et celui employé par l’usager. Lorsqu’ils ne parviennent pas à décrire ou préciser leur besoin d’information, le système de recherche d’information (SRI) doit leur fournir des suggestions de recherches. Faciliter l’orientation contextuelle constitue pour les catalogues un objectif vital du fait de son caractère encyclopédique. L’ajustement aux besoins de l’usager peut être réalisé en le laissant explorer à sa guise un espace de concepts et l’ensemble des documents retrouvés (Hjerppe, 1986). Ces deux aides (navigation dans l’espace des concepts, navigation dans la base des documents) permettent à l’usager d’organiser sa recherche et de choisir la meilleure stratégie pour trouver les termes des questions et les documents qui répondent au mieux à ses besoins. L’usager peut passer facilement d’un niveau à un autre en pointant sur les différents liens hypertextes. Ihadjadene (1999) a montré que dans un tiers des cas, la navigation apporte une aide importante dans la sélection des termes et de documents similaires. Les usagers privilégient les liens sujets et auteurs. La visualisation des réponses joue un rôle important dans les redéfinitions du besoin qu’élaborent les usagers. Le besoin d’information ne reste pas constant au cours de la consultation mais évolue au gré des visualisations des résultats. Le but et les objectifs des usagers, qui ne sont pas prédéterminés dès le départ de la recherche, changent et évoluent en fonction des réponses du système. C’est en se référant à ce modèle, que plusieurs auteurs (Bates, Guthrie et Marchionini, cités par White et al., 2009) justifient l’importance donnée à l’exploration dans les SRI. Pour ces auteurs, les processus de recherche informationnelle s’inscrivent dans des démarches que l’on peut qualifier à la fois d’opportunistes, itératives et pluritactiques. Les usagers dans ce contexte visent à résoudre des problèmes complexes et à développer un renforcement de leurs capacités cognitives. Pour mettre en œuvre ces activités exploratoires, les systèmes facilitent les processus de reconnaissance et d’identification de l’information et minimisent toute demande de spécification de l’information. En effet, il est plus facile aux usagers de découvrir ou de repérer quelque chose qui peut les intéresser que de produire des descriptions formelles. En se basant sur cette approche, les classifications peuvent s’utiliser aussi bien au niveau de l’accès que du filtrage de l’information.
Navigation et découverte de l’information
4Certains auteurs ont cherché à rendre claire à l’usager l’organisation hiérarchique des connaissances en faisant des classifications (CDU, DDC, LCC, CACM, etc.) un outil de navigation. Divers catalogues en ligne offrent un accès sujet par le biais des indices de classification. Ce type d’accès a toujours posé des problèmes aux usagers. C’est pourquoi divers prototypes permettant une navigation dans les catégories des classifications ont été construits. On peut citer parmi les travaux initiateurs DDC DORS (Dewey Online Retrieval System) ou SLC (System Library Catalog) (Ihadjadene, 2005). Pollitt (1997) présente une autre approche pour faciliter la navigation à travers la classification Dewey. Il déconstruit chaque indice en trois sujets (facettes), donnant ainsi à l’usager la possibilité de voir plusieurs « vues » de la base bibliographique. L’émergence du Web ainsi que le succès des moteurs de recherche thématiques tel que Yahoo ont stimulé l’usage des classifications encyclopédiques comme mode d’accès et de navigation. L’International Society for Knowledge Organization (ISKO) publie régulièrement des travaux sur ces questions. On peut aussi citer les travaux de Papy (2005) qui a proposé un système opérationnel VisualCatalog utilisant la classification Dewey et le répertoire Rameau comme mode de navigation.
Classification de l’Association for Computing Machinery

Classification de l’Association for Computing Machinery
5Récemment, Kembellec (2012) a étendu ces possibilités de navigation en proposant au travers d’une interface cartographique à la classification de l’ACM (Association for Computing Machinery) une stratégie d’accès à l’information mêlant requête, filtrage et exploration. Cette démarche s’inscrit dans la continuité des travaux de Zhang sur la visualisation en recherche d’information (Zhang, 2008). Une simple requête (assistée par auto-complétion) dans un champ de formulaire permet de découvrir un contexte de recherche. Une fois un concept, un terme ou un nom sélectionné, un focus se crée autour, positionnant le besoin d’information dans la taxonomie issue de l’alignement des vocabulaires d’autorités sur la classification du domaine de connaissance d’ACM. L’usager peut ensuite affiner sa recherche par navigation ou consulter des sujets connexes par sérendipité. Si le terme ou l’entité nommée qu’il cherchait n’est pas répertorié, libre à lui de l’ajouter. Cet ajout de mot-clé (« tagging folksonomique », voir plus loin) lui sera bénéfique, puisqu’il pourra régulièrement venir effectuer sa veille scientifique sur son domaine de prédilection avec un point d’entrée personnalisé.
6Le vocabulaire d’entrée des langages classificatoires est encore très restreint par rapport à la richesse sémantique des termes qui sont quotidiennement entrés dans les SRI. Il faudra donc enrichir le vocabulaire d’entrée aux SRI en concevant des interfaces qui dirigent l’usager vers les classes à partir des termes de la requête de l’usager (Buckland, 1999). Toutefois, certains auteurs élargissent cette approche à une participation active des usagers. Le succès des folksonomies témoigne de ces nouvelles pratiques liées aux usages de l’information. Cette pratique consiste pour un individu à mettre en rapport des étiquettes (tags) avec des documents. Les folksonomies jouent le rôle à la fois de moyen d’accès et de recommandation de l’information (Balmisse, 2006). L’apparition des folksonomies montre que l’on peut trouver de l’information dans une communauté étendue sans se référer à un langage d’autorité. Ce « système des subjectivités » basé sur l’échange de jugements à propos de sources s’oppose à l’autorité scientifique et morale que reflète une classification documentaire. Même si concrètement, les langages d’autorité possèdent eux aussi un caractère subjectif, comme le prouvent les différences de cotation d’un même document entre plusieurs langages d’autorité et même dans l’utilisation d’un même langage.
7Dans cette perspective, les classifications documentaires et les systèmes d’autorité peuvent être considérés comme des types de folksonomies où la subjectivité de l’individu est exprimée par une institution scientifique, morale. Toutefois, les folksonomies ont aussi leurs limites. L’indexation sociale utilise le plus souvent un vocabulaire de description qui, n’étant pas normalisé, le rend aussi difficile à traiter automatiquement que le langage naturel. Plus encore, l’utilisation d’acronymes rend son traitement automatique impossible. Certains auteurs proposent des approches privilégiant le tagging sémantique en utilisant comme référentiel un système d’organisation des connaissances (thésaurus ou listes d’autorité) ou même une cartographie conceptuelle pour exprimer en un seul clic un concept complexe (Szoniecky, 2012a). Si les classifications en ligne peuvent jouer un rôle dans l’accès et la navigation, elles le peuvent aussi dans la catégorisation des réponses.
Catégorisation des réponses : le pouvoir des facettes
8C’est Ranganathan qui est à l’origine de cette approche « classifications à facettes ». Les sujets peuvent toujours être décrits par l’analyse de cinq aspects de la réalité qu’il décrit dans la formule PMEST (personnalité, matière, énergie, espace, temps). Il désigne ces cinq catégories fondamentales sous le terme « ambigu » de facettes (De Grolier, 1962 ; Maniez, 2002). D. J. Foskett en fait le synonyme de catégorie (De Grolier, 1962) alors que Jean Aitchison, spécialiste des thésaurus à facettes, semble assimiler selon Maniez (2002) facette et critère de division. C’est cette acception restreinte de la notion de facette qu’on retrouve dans la majorité des travaux et dispositifs actuels. Les interfaces dites à facettes utilisent des métadonnées comme critères de partition des réponses. L’approche par facettes est appropriée pour organiser les ressources du Web, en démultiplie les accès et en rend les métadonnées plus visibles à l’usager (Balmisse, 2006). Ce dernier ne filtre les résultats qu’avec des attributs valides et en fonction des métadonnées associées aux documents. C’est à partir de cette définition réduite et en se basant sur les travaux de Pollitt, que nous avons mis en œuvre dès 1998 un système permettant de catégoriser aussi bien les résultats de recherche (notices bibliographiques) que les vedettes matières en utilisant la classification décimale de Dewey (Ihadjadene, 2005). Malgré le succès actuel des interfaces facettes, il est important de rappeler que cette approche de visualisation des résultats est ancienne (Pollitt, 1997). On retrouve la même logique au niveau des moteurs de recherche tels que NorthernLight, Vivisimo ou Exalead. Dans le cas des catalogues en ligne, la mise en œuvre des facettes s’appuie souvent sur une déconstruction des vedettes matières issues des listes d’autorité de type Rameau (Répertoire d’autorité-matière encyclopédique et alphabétique unifié). L’usager peut circonscrire ses recherches en utilisant par exemple les subdivisions géographiques ou la restriction à une période historique donnée (Maisonneuve, 2007) Si les experts de domaine profitent des vocabulaires contrôlés, les résultats sont plus mitigés pour des utilisateurs novices. Dans le cas des catalogues, certaines expérimentations montrent que les facettes sont effectivement utilisées (entre 10 et 30 % des recherches) et permettent à l’usager de saisir la structure du domaine (Niu et Hemminger, 2011). Les facteurs de limitation sont variables selon les travaux. On retrouve toutefois un intérêt pour la restriction des résultats par le format des documents, la langue, le lieu (localisation), les vedettes et enfin les indices de classification. La complexité des représentations à facette des résultats peut engendrer auprès des utilisateurs une surcharge cognitive (Balmisse, 2007).
De nouveaux horizons pour la classification des informations
9Une des solutions pour aider les internautes à consulter les résultats est proposée par les outils de visualisation de l’information. Elles consistent, par exemple, à présenter des formes géométriques (sphères, cercles colorés) dont les traits perceptifs (taille, couleur, forme) sont censés représenter des informations pertinentes pour la recherche d’information (Ciaccia et al., 2006). Dans ces interfaces de visualisation de l’information, ce n’est plus uniquement la connaissance première de la simple vision d’une représentation qui devient importante, mais sa manipulation qui permet à l’utilisateur de construire une représentation mentale et ainsi se confronter à une démarche réflexive sur sa propre activité de recherche (Thièvre, 2006).
10Pour illustrer ces fonctions de manipulation et d’analyse, Szoniecky (2012b) a développé un vocabulaire allégorique et des interfaces permettant de manipuler graphiquement l’information en utilisant un module générique d’agent allégorique inspiré de l’interprétation faite par Deleuze de l’éthique spinoziste. Le principe consiste à partager l’information en trois dimensions d’existences : documents physiques ; rapports ; concepts. Nous avons montré un exemple d’utilisation de cet agent avec le diagramme de la figure 2. On y voit comment le livre et les codes de classification représentent par des rectangles la dimension du document physique (papier, encre, couverture, etc.) ; les bibliothèques et les langages de classification représentent par des octogones les existences individuelles ou collectives qui créent les rapports entre les documents et les concepts représentés par des cercles. Bien évidemment, il faut concevoir ce diagramme comme dynamique et interactif. Suivant les besoins, chaque dimension peut être décomposée en éléments plus petits ou groupée en un ensemble plus grand. Par exemple pour les documents, le livre se décompose en pages, la page en phrases, etc. De même pour les existences créatrices de rapports qu’on peut décomposer suivant un organigramme institutionnel (services, responsable, adjoint, etc.) ou pour les concepts qui, selon les principes de la taxonomie, se composent en catégories – par exemple « philosophie » et « psychiatrie » – qu’on regroupe dans le concept de « disciplines universitaires ». Ces détails et ces regroupements proposent un potentiel de rapports qui seront effectués ou non suivant le choix des institutions ou des individus par rapport à un contexte donné. Ainsi, on représente à différentes échelles les pratiques de classification et leurs évolutions possibles pour s’en servir comme support de réflexion et d’apprentissages.
Subjectivité des langages d’autorités

Subjectivité des langages d’autorités
11Szoniecky illustre le fait que ce qui est important dans l’approche allégorique, c’est de rendre compréhensible la complexité des traitements automatiques faits sur les symboles par l’informatique. Une allégorie basée sur une analogie (Hofstadter et Sander, 2013) transformant les « systèmes d’information » en « écosystème d’information » permet par exemple de mettre en perspective les traitements informatiques dans une complexité globale que nous expérimentons tous les jours, celle de notre écosystème naturel, et ainsi de mieux comprendre la complexité en jeu. De même, il est assez simple de développer un algorithme pour rapprocher deux listes de tags : mais avec l’approche allégorique, ce qui compte c’est de pouvoir expliquer graphiquement ce qui est « en train de se faire » et d’impliquer l’utilisateur dans cette démarche. Ainsi, ce qui prime selon Szoniecky (2012b), ce n’est plus le principe du moindre effort, mais l’implication de l’utilisateur dans une démarche de recherche où l’accumulation des efforts dans le temps permet d’une part la mise en place d’un système de recommandation de qualité (Hachour et Szoniecky, 2012) et d’autre part d’inciter l’utilisateur à une méta-réflexivité sur son activité de recherche documentaire. Dans ce cas, nous nous orientons vers une recherche documentaire qui privilégie la perspective d’une modélisation du point de vue de l’utilisateur par la récolte de son activité de recherche, pour affiner au fil du temps un profil de classification permettant un filtrage de plus en plus précis des informations.
12Nos modes d’accès à l’information ont subrepticement évolué avec le Web. Nous avons présenté dans cet article trois approches pour l’organisation de l’information conçues par des chercheurs de l’université Paris 8 : la première développée par Kembellec (2012) pour permettre de naviguer dans les catégories de la classification de l’ACM ; la seconde, plus ancienne (Ihadjadene, 2005), permettant d’utiliser les classifications pour un regroupement thématique des résultats et des vedettes matières (Rameau) ; enfin, la dernière privilégie l’utilisation de l’allégorie pour la visualisation de l’information (Szoniecky, 2012). Comme les classifications, les visualisations ne sont pas neutres. Hullman et Diakopoulos (2011) examinent les techniques rhétoriques utilisées dans des visualisations narratives et leur potentiel pour encadrer des questions et pour promouvoir des interprétations particulières. Hall (2008) cherche à comprendre comment les visualisations influencent et autorisent une forme de pensée à travers une manipulation de l’esthétique, et du choix des données. Une approche critique de ces outils nous invite à réfléchir sur les dimensions cachées des données. Nous sommes aujourd’hui dans un monde documentaire où nous ne pouvons plus défendre l’ambition d’une exhaustivité que même les grandes institutions ne peuvent plus atteindre à travers les principes du « dépôt légal ». Et même dans le cas où l’on pourrait tout conserver, les problèmes théoriques et pratiques des big data restent encore à résoudre notamment concernant la représentativité des données ou la multiplication des « micro-interprétations » nécessaires aux traitements statistiques et à leur représentation (Boyd & Crawford, 2011).
13Face à ces questions autour des pratiques de classification, les bibliothèques sont des laboratoires privilégiés pour expérimenter les moyens de parvenir à une société de la connaissance permettant à chacun d’exprimer son point de vue et de le partager avec tous, demeurant ainsi selon Robert Damien un espace, un « lieu des liens » (Melot, 2004). De par leur ancrage dans les territoires, les bibliothèques ont un rôle fondamental à jouer dans le développement de cette société, par exemple en proposant des espaces pour la transmission des méthodes d’organisation rigoureuse de l’information. Nous pensons que la société de la connaissance passe nécessairement par une éducation de ses membres aux enjeux de la classification par un apprentissage de la réflexivité nécessaire à sa pratique. Les bibliothèques sont le lieu adéquat pour cet apprentissage, car elles possèdent deux avantages prépondérants : celui de l’expérience séculaire pour l’organisation de l’information et celui de posséder des ressources documentaires disponibles physiquement pour expérimenter la classification.