Techniques modernes d'administration des archives et de gestion des documents : recueil de textes (UNESCO, 1985, 619 p.)
close this bookTechniques modernes d'administration des archives et de gestion des documents : recueil de textes (UNESCO, 1985, 619 p.)
close this folderVII - Classement et description
close this folderL'Indexation-matières à vocabulaire contrôle dans les archives
View the document(introduction...)
View the documentNature de l'indexation-matières des archives
View the documentClassification et cohèrence
View the documentInformatique et édition
View the documentL'application aux papiers ministeriels. Le niveau d'indexation
View the documentLes papiers ministeriels. Construction et emploi de la classification externe
View the documentAppendice : Papiers ministeriels de 1938

La classification, qui consiste à regrouper des sujets connexes sous un seul titre, a été, naturellement, employée régulièrement dans les index d'archives, pour des raisons largement méthodologiques et avec une méthode alphabétique. Non seulement l'ordre alphabétique a été le fondement du classement à l'intérieur d'une rubrique, mais encore les titres des rubriques ont été eux-mêmes classés alphabétiquement pour former l'index dans son ensemble. Je ne connais pas de cas où l'on ait essayé de regrouper des rubriques connexes d'une façon complètement logique quoiqu'on trouve un aspect de ce type de classification dans la rubrique "Actions" (procès) de l'index-matières des Curia Regis Rolls. Dans l'ensemble, l'index général, combinant les matières et les noms, comme on en trouve un exemple dans le Main Index (Index principal) du Foreign Office, a été plus répandu que l'index-matières distinct, tel celui des Curia Regis Rolls, et si l'on considère la nature des recherches menées dans les archives, qui dépendent aussi du caractère particulier des documents, cela est certainement convenable. Quand on fait une recherche particulière combinant des éléments nominatifs et des éléments abstraits, il est plus commode d'avoir un seul index dans lequel on peut pointer l'une ou l'autre entrée recherchée, et il est généralement préférable que les entrées soient présentées comme des articles particuliers plutôt que réunies en groupes. Il y a, naturellement, de nombreux cas où l'auteur d'un index peut raisonnablement penser que quelqu'un qui s'intéresse à un sujet A peut également s'intéresser à un sujet B. si bien que, dans cette mesure, il est commode de les présenter ensemble sous une rubrique plus générale. Je suis certain qu'il y a eu bien plus de cas dans lesquels le regroupement a été méthodologique dans son principe et tout à fait indépendant du souci d'aider le lecteur, à tel point qu'une tendance s'est développée qui condamnait toute entrée particulière. On a fait des index dont toutes les entrées ont été réparties entre des rubriques abstraites (qui régissent ainsi la position des entrées dans l'index), même quand ces rubriques ne comptaient qu'une seule entrée, de sorte qu'il n'y avait pas de regroupement analogique. Tel est l'arrière-plan méthodologique.

L'une des grandes difficultés que rencontrent les auteurs d'index-matières, notamment par rapport aux auteurs d'index nominatifs, c'est la cohérence : ils ont constamment à se demander : "cette matière a-t-elle déjà été indexée ?", ou, en d'autres termes, "ai-je indexé, à tel ou tel niveau, ce type de document ?" et encore : "cette matière doit entrer dans l'index, mais quel vocabulaire ai-je employé ?". Pour parvenir à cette cohérence, on a alors un besoin constant de se reporter à des index antérieurs d'ensembles d'archives ou à des étapes précédentes de l'index en cours, et ce type de contrôle est facilité si l'auteur de l'index sait qu'une matière particulière, quand elle apparaît, entre dans un groupe particulier, quel que soit le vocabulaire utilisé pour la décrire. Car un groupe de ce genre est plus bref à examiner qu'un index tout entier et c'est, de toute façon, un groupe de précédents plutôt que des entrées isolées que l'auteur de l'index doit considérer de temps en temps pour maintenir la cohérence. Les utilisateurs de l'index, d'autre part, peuvent très souvent rechercher directement l'entrée particulière dont ils ont besoin, surtout dans le cas d'un index offrant de nombreuses entrées spécifiques introduites par des noms. En ce qui concerne les entrées-matière directes, il est souvent inutile d'imposer une étape intermédiaire consistant à décider quel groupe (ou quels groupes) de matières on doit considérer, même quand cette décision est simplement une affaire de renvois. Cela ne signifie pas, comme on l'a déjà remarqué, qu'il n'y a pas d'exemples où un chercheur s'intéressant à A puisse tellement s'intéresser à B qu'il soit juste, de son point de vue, de regrouper ces termes. Cela ne signifie pas non plus qu'il n'y ait pas de chercheurs qui aient besoin d'une sorte de classification pour restreindre leurs recherches plus générales. Mais cela signifie que, dans l'ensemble, les index-matières d'archives doivent comporter des entrées spécifiques particulières et, notamment, que tout regroupement d'entrées devrait être effectué dans l'intérêt du chercheur et non pour un quelconque avantage mécanique et momentané dont l'auteur de l'index puisse profiter.

La nature du document impose la spécificité dans l'analyse ; le maintien de cette spécificité dans la composition de l'index est avantageux pour le lecteur. Il est donc improbable qu'une classification préfabriquée puisse servir à indexer des archives, comme on l'a fait pour les besoins des bibliothèques. Diverses séries d'archives diffèrent très sensiblement de contenu, et il est plus avantageux de développer autant que nécessaire la classification pour indexer une série. Comme on l'a montré, ce besoin, en termes quantitatifs, peut n'être point considérable quoique, dans chaque cas, il faille une espèce de contrôle de la cohérence, mais ce besoin est celui d'un produit sur mesures. La situation peut bien être différente pour l'indexation systématique des guides de Services d'Archives ou des informations analogues, et il serait souhaitable, si possible, que tous les guides soient indexés de la même manière ou que des index conjoints soient préparés pour ces guides.

On a donc besoin d'index spécifiques, en ce sens que les entrées, dans l'ensemble, ne sont pas disposées par groupes-matières ; d'index généraux en ce sens que matières et noms apparaissent dans un seul ordre, et non séparément, et d'index dotés néanmoins d'une sorte de contrôle de la cohérence. La question est de savoir si l'on peut établir de tels index de façon systématique, et en particulier avec l'aide de machines. La question connexe du remplacement des index par des machines, je ne propose pas de la considérer dans l'idée que les lecteurs d'archives préféreraient avoir des index conventionnels qui peuvent être portés, envoyés et consultés n'importe où, et que les techniques si avancées des systèmes d'interrogation seraient mal adaptées aux recherches dans les archives. Puisque l'élaboration d'un index-matières implique une succession de décisions, dont chacune devrait être un précèdent, nous devrions examiner si ces décisions peuvent être enregistrées de façon que ce précédent s'effectue ensuite automatiquement, chose qui épargnerait à l'auteur de l'index le laborieux contrôle des précédents ou la prise de décisions là où des décisions ont, déjà, été prises. Cela doit naturellement permettre de modifier les décisions de l'auteur de l'index ou l'économie du système.

Quand les index sont stockés sous une forme qui peut être lue automatiquement, ils peuvent être mêlés pour constituer des index communs ou pour en produire des listes sélectives, pourvu qu'ils aient été établis de façon concordante ou qu'il y ait un système pour abolir les incohérences. Si un système de ce genre peut permettre d'éviter des tâches de copiste dans la construction d'un index, les possibilités de fusions ou d'extraits sélectifs peuvent être considérées comme un bénéfice.

Cela m'amène à la question de la cohérence, dont on a dit que c'était la qualité essentielle d'un index satisfaisant. Si un index doit donner satisfaction, il doit être cohérent, entre autres, dans le choix des choses et des idées à indexer et aussi, pour dé nombreux documents, dans le choix des noms. Des documents semblables devraient être indexés de façon semblable, en ce qui concerne le détail, le niveau et l'appréhension. Je ne vois aucune possibilité de mécaniser de tels choix. Les termes servant à indexer un texte peuvent ne pas apparaître dans ce même texte, ce qui aurait permis de les extraire grâce à un crible mécanique, et, même pour les noms, il ne paraît pas y avoir de règles sures permettant de les extraire du texte pour les intégrer dans un index. Combien est-il encore moins possible, alors, de plier à des règles le choix des mots-matière, puisqu'il dépend de la connaissance du sujet et de l'évaluation de l'intérêt du texte, bref, de la compréhension du texte ? On peut être assuré que les entrées correctes d'index dans ce domaine ne peuvent être préparées que par l'intervention de personnes qui doivent conserver la responsabilité de leurs choix, même si, comme on le verra, elles peuvent s'aider de moyens mécaniques.

Le point suivant est de vérifier que le vocabulaire employé est cohérent avec celui qu'on a employé auparavant, que la même notion est exprimée dans les mêmes termes, et que toute forme de classification ou de regroupement utilisée précédemment est toujours utilisée. Dans la plupart des index d'archives, les entrées n'ont que leur terme (ou groupe de mots) initial qui soit traité comme une matière, et toutes les modifications, subséquentes, de ce terme initial sont simplement classée de manière alphabétique ; ainsi, on peut trouver : "Exportations, d'armes par l'Allemagne", et "Exportations, promotions (des), par la politique gouvernementale", sans qu'on essaie d'établir des relations logiques entre le terme initial et le développement variable, ni de classer ces variables selon des schémas standardisés ou des ordres logiques. Il s'ensuit que toutes les décisions précédentes concernent ces termes qui consistent eux-mêmes en un ou deux mots, et que toutes ces décisions peuvent être conservées indépendamment de l'index. Ces décisions n'influent pas nécessairement sur sa composition, quoiqu'elles le puissent, et on peut s'y référer par des mots correspondants. Cela peut se faire mécaniquement.

On a suggéré, dans le cas d'entrées consistant en termes et en relations définies, qu'on pourrait-élaborer une classification qui puisse se développer automatiquement à partir des relations i. Cela n'est pas possible ici, puisqu'il n'y a pas de relations dans les entrées ; mais on pourrait, jusqu'à un certain point, former une classification qui se développe naturellement grâce à l'enregistrement de toutes les décisions prises pour le vocabulaire et le classement. Il en va ainsi dans la mesure où une classification est faite de décisions concernant le vocabulaire et le classement de l'index lui-même, c'est-à-dire au niveau inférieur ; mais les niveaux supérieurs, nécessaires pour garantir une cohérence complète, doivent être une création délibérée.

L'ensemble de la classification qui consiste en ces deux éléments peut être conservé indépendamment de l'index, les entrées proposées peuvent lui être confrontées et il peut lui-même être imprimé totalement ou partiellement selon le besoin. On peut ainsi avoir la direction générale qui est nécessaire à la construction cohérente d'index successifs sans qu'on touche au classement interne de ces index dans leur forme publiée, sauf quand on a pris une décision concernant le classement interne en considérant l'avantage de l'utilisateur.

La classification, en ce sens, consistera dans les décisions prises à propos des regroupements et des synonymes au sein de l'index, et aussi dans le classement, selon un plan logique, des termes qu'on peut accepter comme mots-souche pour l'index. Ces mots-souche ou termes initiaux apparaîtront alphabêtiquement dans l'index et régiront de ce fait son agencement, mais ils seront arrangés conceptuellement dans la partie supérieure de la classification. Toute la classification sera formée de termes liés par l'une de ces trois sortes de relations. Dans l'index, il y aura une relation subordonnée dans laquelle A, pour les besoins dudit index, sera un sous-titre de B. si bien que toutes les entrées relatives à A se trouveront à : B. A. Entre les mots-souche et la partie supérieure (ou externe) de la classification et aussi dans cette dernière, il y aura une relation qui sera largement, mais pas entièrement, de subordination ; ainsi, il arrivera souvent que A soit un exemple ou un élément de B. mais A pourrait aussi être un aspect de B ou avoir une parenté avec B.

Le divorce des éléments subordonnés, variables, et de référence, de l'entrée indexée d'avec les termes qui entrent dans la classification a un heureux effet sur cette dernière et sur l'index.

La classification externe est beaucoup moins encombrante que celle qui informe et s'exprime en un index complet, et, parce qu'elle est compacte, elle n'a plus besoin d'être strictement hiérarchisée. Dans un classement tout à fait hiérarchisé, tout concept a sa place sous un seul autre concept avec lequel il a une relation de subordination, tandis que, si l'on a assez d'espace, on peut inclure les multiples relations des concepts. Ainsi, nous pouvons relier le mot "réarmement" à la fois à "industrie" et à "armes", et dans ces deux relations il sera associé à deux groupes différents de mots-souche apparentés. L'expression d'un tel réseau multidimensionnel implique beaucoup de répétitions et n'est possible que si les termes à relier ne consistent qu'en un mot ou deux ; il ne pourrait être réalisé même dans un petit index parce que la nécessaire répétition des entrées - chacune comportant mot souche, terme subordonné, variable et référence - serait impraticable.

Le réseau multidimensionnel donne une image bien plus fidèle de la situation conceptuelle que l'architecture hiérarchisée dont la rigidité doit être brisée par l'emploi de renvois indiquant des relations non indiquées par la classification si l'on s'en sert.

Cette idée de la classification séparée de l'index a ses antécédents. Dans l'Inventaire des archives de la ville de Strasbourg, série VII, il y a une table des groupes de mots-souche tirés de l'index, sous des rubriques telles que "histoire militaire" et "vie intellectuelle". Cela a pour but d'économiser l'espace des renvois et des entrées répétées. Un procédé quelque peu semblable a été utilisé pour l'index-matières du Calendar of liberate rolls, vol. VI, afin de renvoyer aux groupes rassemblant des entrées, tels que "arms, armour" et "trades and occupations" ; les termes apparaissant ici sont intermédiaires entre les deux niveaux de termes employés pour l'index de Strasbourg. Dans ces deux cas, les tables initiales dépendaient de ce qui entrait dans l'index, à la différence du type de classification élaboré dans les bibliothèques, classification qui est alors préparée à l'avance et destinée à satisfaire tous les besoins, et qui, ensuite, régit le classement des livres ou le catalogue, plutôt qu'elle n'en découle.

Il est, bien sûr, beaucoup plus aisé de développer à partir d'un index ou d'une série d'index juste la classification nécessaire que d'établir in vacuo une classification générale applicable au classement d'articles encore virtuels.

Cela nous amène à un autre caractère indispensable du système, à savoir qu'il doit être possible de corriger et d'étendre la classification selon les besoins. Cela doit se faire de façon cohérente après un examen de la classification existante, et sans détruire l'utilité des index existants. En particulier, on ne doit pas affecter les possibilités de fusion ou d'extraction des index. Dans la mesure où l'index n'est pas façonné par la classification, ces possibilités sont préservées et, pour autant que l'index soit arrangé selon la classification, des problèmes de rénovation peuvent toucher la forme sous laquelle est conservé l'index à lecture automatique. Hormis la possibilité de fusion, l'intérêt des index antérieurs subsiste simplement du fait de leur existence indépendante sous forme imprimée, sans préjudice de ce qu'on peut faire aux versions à lecture automatique.

Le fait que la classification existe en dehors de tout index réel permet ainsi de la modifier sans dommage ; cette existence distincte a aussi son effet sur le style de l'indexation. Le rédacteur de l'index peut viser àidentifier les aspects importants du document et à les exprimer dans le vocabulaire qui est immédiatement approprié" tout en sachant que la combinaison de ces aspects dans des points de vue plus généraux et la comparaison de son vocabulaire avec celui qui a été employé précédemment seront effectuées séparément et, dans une certaine mesure, automatiquement. Cela devrait l'encourager à rédiger des entrées d'index spécifiques plutôt que générales, dans lesquelles son analyse suive de près la teneur du document. Une telle spécificité, on l'a déjà montré, est un caractère souhaitable des index d'archives.

Chaque fois qu'on imprime un index réalisé, il faudrait imprimer aussi et publier en introduction à cet index la partie externe de la classification qui concerne les termes utilisés comme mots-souche dans ledit index. Les rubriques de cette partie de la classification devraient apparaître - ou être l'objet de renvois - selon l'ordre strictement alphabétique, de sorte que celui-ci serve d'index à la classification comme aux archives. Avec les classifications de bibliothèque, un index alphabétique s'impose ordinairement et on peut avoir, ici, très simplement le même caractère.

La classification externe, ayant désormais joué son rôle en contrôlant le vocabulaire et, dans une faible mesure, la forme de l'index, peut offrir une aide plus directe au lecteur de l'index. Dans nombre de cas, le lecteur peut aller directement aux termes qui l'intéressent, et c'est pourquoi la spécificité est pertinente, mais certains utilisateurs peuvent se demander par où entrer dans l'index, ou ne pas réussir à y entrer avec les termes qu'ils ont à l'esprit. La classification distincte offrira aux utilisateurs une vision commode de l'index. Même ceux qui ont réussi à entrer dans l'index et ont trouvé leur référence peuvent apprécier d'être guidés vers des idées associées dans la classification, et dans cette démarche ils peuvent s'assurer qu'ils ont bien tout vu, qu'ils ont regardé à tous les termes de l'index qui pourraient les intéresser. Cela se fait, d'une façon qui n'a rien de systématique, par l'emploi des "voir aussi" dans les index classiques d'archives ; de tels renvois ne seront plus utiles.