
Un Grand Dictionnaire universel portatif
Murphy, Cauvin & Lefrère/ Stupra
Marchal & Lecourt / Musée Mallarmé
. Pierre Larousse, Grand Dictionnaire universel du XIXe siècle, REDON, 2002 (PC uniquement), 95 €. Pour des raisons d'espace, et conformément à la tradition de cette chronique, nous présentons ici une version réduite de l'article de J.-Ph. Saint-Gérand. La version complète en est accessible sur le site de la revue : www.histoires-litteraires.org . Ce second prénom ne s'invente pas et, même s'il est directement hérité de son père, revendique l'immortalité dès les fonts baptismaux ! . Plus encore si l'on songe que Borges a écrit que " la littérature est, et ne peut être considérée comme autre chose qu'une sorte d'extension et d'application de certaines propriétés du langage " (Œuvres complètes, Gallimard, Pléiade, I, p. 1154). . Il s'agit là d'une série en trois tomes, publiée en 1835 sous la direction d'Abel Hugo, qui s'intitule expressément : France pittoresque ou Description pittoresque, topographique et statistique des Départements et Colonies de la France, offrant en résumé pour chaque département et colonie, l'histoire, les antiquités, la topographie, la météorologie, l'histoire naturelle, la division politique et administrative, la description générale et pittoresque du pays, la description particulière des villes, bourgs, communes et châteaux, celle des mœurs, coutumes et costumes, etc. Avec des notes sur les langues, idiomes et patois, sur l'instruction publique et la bibliographie locale, sur les hommes célèbres, etc. Et des renseignements statistiques sur la population, l'industrie, le commerce, l'agriculture, la richesse territoriale, les impôts, etc., etc. Accompagnée de la statistique générale de la France, sous le rapport politique, militaire, judiciaire, financier, moral, médical, agricole, industriel et commercial, par A. Hugo, ancien officier d'état-major, membre de plusieurs sociétés savantes et littéraires, auteur de l'Histoire de Napoléon. Delloye, éditeur de la France militaire, Place de la Bourse, rue des Filles-Saint-Thomas, 13. Trois volumes de 320 p. chacun, sur deux colonnes en typographie minuscule et serrée, agrémentés de magnifiques cartes gravées…. C'est là tout un programme, dont Larousse, à l'évidence, s'inspire fortement (la date de parution correspond à celle des années de formation du jeune Pierre-Athanase), et qu'il n'aura plus qu'à réactualiser au fur et à mesure des développements de l'industrie et des accidents de l'histoire… . Après l'indexation exhaustive de toutes les entrées, et en attendant celle des sous-entrées, il s'agissait ici de définir chaque item lexical par sa position dans une page, une colonne, un numéro de ligne et une place à l'intérieur de cette ligne… . Gilles Roques, " Des régionalismes dans les dictionnaires des XIXe et XXe siècles ", Travaux de Linguistique et de Philologie, xxvi, Strasbourg-Nancy, 1988, pp. 236-250. . Cf. Peter Koch et Wulf Österreicher, Gesprochene Sprache in der Romania : Französisch, Italienisch, Spanisch, Tübingen, Niemeyer, 1990. . Lorédan Larchey, Émile Boutmy, etc. . Michel Glatigny, Les Marques d'usage dans les dictionnaires français monolingues du XIXe siècle, Tübingen, Niemeyer, 1998, pp. 354-355. . François Rastier, Arts et sciences du texte, PUF, 2001, Collection Formes sémiotiques, p. 21. . Voir : Étienne Brunet, " Que disent les tables ? Que disent les chiffres ? ", Colloque ALLC-ACH, Toronto, juin 1989 ; Laurent Catach, " Graphist : logiciel de lemmatisation, indexation et modernisation automatique de textes anciens ", in Lancashire & Wooldridge, 1994, pp. 183-196 ; Isabelle Turcan, " L'informatisation du Dictionnaire étymologique de Gilles Ménage (1694) ", in Lancashire & Wooldridge, 1994, pp. 131-142 ; Isabelle Turcan, et Terence Russon Wooldridge, " Les mots-clés métalinguistiques comme outil d'interrogation structurante des dictionnaires anciens : le cas du Dictionnaire de l'Académie en comparaison avec le Thresor de Nicot et le Dictionnaire étymologique de Ménage ", Colloque LTT sur " Lexicomatique et Dictionnairiques ", Université Lyon II., 1995 ; Mark Olsen, et A.M. McLean, " Optical Character Scanning : A Discussion of Efficiency and Politics ", in Computers and the Humanities, 27, 1993, pp. 121-127 ; T.R. Wooldridge, " Le flou en informatique textuelle ", in Texte, 13/14, pp. 275-289 ; T.R. Wooldridge, " Bases dictionnairiques, bases philologiques, bases de connaissances culturelles ", Colloque " Autour de l'informatisation du Trésor de la langue française ", Nancy, 1994 ; T.R. Wooldridge, " Dictionnaires anciens informatisés et bases de données électroniques ", Première Semaine de l'École interlatine des hautes études en linguistique appliquée, Real Academia Española, San Millán de la Cogolla, 1995.
L'objet
Le Grand Dictionnaire universel du XIXe siècle de Pierre Larousse a déjà fait l'objet, en 1999, d'une version électronique aux éditions Champion - sur laquelle divers jugements se sont exprimés en France et à l'étranger - et pour laquelle le responsable éditorial, Claude Blum, m'avait contacté par téléphone au printemps 1998, alors que l'idée de mon propre travail avait déjà été divulguée et était connue de la communauté scientifique par plusieurs communications et annonces de recherche de moyens techniques, scientifiques et de subsides. À la suite de cet appel resté sans suite, il ne me fut plus communiqué aucune information de la part de ce contact. Pris évidemment de vitesse par une entreprise qui se déclarait alors concurrente et qui bénéficiait de supports collectifs dont ne pouvait se prévaloir un chercheur isolé, je n'en ai pas moins continué à développer de mon côté réflexions et travaux préliminaires, proposant une participation aux institutions - Université de rattachement (Clermont II), Institut universitaire de France, Conseil régional d'Auvergne - susceptibles de s'intéresser au développement de mon projet, et recueillant partout une unanime fin de non-recevoir. C'est donc seul, avec l'unique soutien et les compétences de Ghislain Geitner, l'infatigable créateur des éditions électroniques Redon, ainsi qu'avec la confiance d'Isabelle Turcan, que j'ai poursuivi la réalisation de cette idée de jeunesse dont Vigny disait, par l'intermédiaire de Cinq-Mars, que la réalisation en l'âge mûr pouvait être considérée comme le signe d'une vie accomplie. Était-ce vraiment là un objectif, si ce n'est un dessein, que d'enfermer sa vie dans les colonnes d'un dictionnaire, fût-il universel ?
Précédé, en 1856, d'un Nouveau Dictionnaire de la langue française à destination des écoles, l'ensemble des dix-sept tomes du Grand Dictionnaire universel du XIXe siècle de Pierre-Athanase Larousse - désormais abrégé en GDU - constitue à tous égards, tant sous l'aspect massif que sous l'aspect gnoséologique, une somme monumentale de la lexicographie française. Ses 524 livraisons en cahiers de 25 feuilles, vendus au prix longuement réfléchi de cinq francs-or, ont été publiées du 27 décembre 1863 au 30 septembre 1876, mais l'ensemble fut probablement conçu et commencé vers 1843 (à l'apogée du règne de L.-N. Bescherelle, grammairien et lexicographe d'un autre temps), soit 24 036 pages sur quatre colonnes, soit encore 96 144 colonnes de texte en corps minuscule, et plus de 483 millions de signes, escortés et rehaussés de lettrines, culs-de-lampe, gravures, schémas, formules mathématiques, physiques ou chimiques, et extraits de partitions, en neumes comme en notation grégorienne, incluant d'innombrables anecdotes, soit encore la matière de 200 volumes in-octavo ou de 850 romans de 350 pages, pour le corps principal des quinze premiers volumes de la série, et respectivement 1322 puis 2024 autres pages toujours serrées sur quatre colonnes pour les deux suppléments de 1876 et de 1888-1890.
L'ensemble sera tiré à 150 000 séries environ, reliées et essaimées entre 1876 et 1930 par le vaste monde… dont aujourd'hui, chaque année, plusieurs dizaines d'exemplaires sont réduits en poussière par l'usure du temps et l'érodante acidification d'un papier ayant très mal supporté l'usage. Le paradoxe est ici que chaque manipulation de ces volumes dans les rayons d'usuels de nos bibliothèques assure simultanément la gloire et la ruine de ce grand œuvre. Bref, le GDU constitue une œuvre révolutionnaire dans son fond, sa forme et ses moyens, qui jouit encore aujourd'hui d'une notoriété inégalée parmi les ouvrages du genre : la quantité et la variété des mentions qui en sont faites à titre documentaire dans les ouvrages imprimés de tous genres sont à cet égard des indices probants, que redouble et confirme de surcroît le nombre de sites internet dans les pages desquels apparaît une mention de son intitulé.
L'intention
Si Pierre Larousse notait à la dernière ligne de la préface du GDU : " le germe de 89 est impérissable ; il serait déjà arraché, s'il avait pu l'être ", on peut considérer que, de ses propres semailles, toute une vie a surgi, suivie d'une dynamique posthume dont le maître d'œuvre n'imaginait peut-être pas le retentissement. L'ouvrage qui en résulta constitue un univers à lui seul, une bibliothèque alexandrine concentrée sur quelques mètres de rayonnages. La postérité que nous sommes découvre qu'il était la réalisation avant la lettre d'un véritable mythe borgésien et qu'en outre il continue parfaitement en cet admirable siècle des dictionnaires l'esprit encyclopédique des Lumières : un esprit curieux de tout, globalisant, certes, mais acéré, et avant tout critique, historique, désormais idéologiquement engagé, et sous-tendu par une organisation très concertée dans laquelle l'artisanat se soumettait aux dures lois de l'édition devenue industrielle. Et il était plaisant de penser que - mutatis mutandis - le monde contemporain offrait les mêmes contraintes techniques et épistémologiques à qui voulait prendre la responsabilité d'informatiser ce monument. Le programme et l'ambition que Larousse se donnait pour le GDU était en effet de faire converger et d'articuler en un seul ouvrage trois perspectives :
- une approche linguistique : définition du vocable par sa position à l'intérieur de l'ensemble du lexique français (histoire, épithètes, antonymes, synonymes, homonymes, prononciation, phraséologie, etc.) ;
- une approche terminologique recouvrant l'ensemble contemporain des sciences, des techniques et des arts (assignation de valeurs sémantiques particulières et définition de marqueurs de domaines, toutes procédures permettant de définir des aires de répartition des formes de discours, indicatrices de la dimension sociale de la variation linguistique qu'exprime un langage technique ou fortement imprégné de particularismes sociaux) ;
- une approche encyclopédique, essentiellement nominale pour la forme et réaliste dans son contenu, qui expose les données et les faits avec un style personnel, dans un discours souvent polémique accentuant les contenus idéologiques, et qui a fréquemment recours aux vertus phatiques et illustratives des anecdotes ou des allusions personnelles.
C'est ce mélange qui fait du GDU une œuvre unique, tellement représentative des tensions idéologiques et conceptuelles, et des contradictions multiples du XIXe siècle. Alors que les perspectives linguistique et terminologique étaient placées sous le signe de la rigueur et de l'objectivité, la perspective encyclopédique du GDU laissait libre cours à l'imaginaire du lexicographe, à ses engagements et à ceux de ses collaborateurs. Mais, de cette disparité consciemment établie, il ne s'agit pas de tirer la conclusion que le lexicographe serait inférieur à l'encyclopédiste : le discours du dictionnaire les solidarise, et c'est celui-ci seul que nous connaissons aujourd'hui à la pointe extrême d'une floraison d'ouvrages revendiquant le même intitulé universel mais n'affichant pas - loin de là - toutes ses qualités d'information explicite et implicite, de provocation, de stimulation incessante du procès de la connaissance.
Si donc - le sens polémique en plus - le GDU peut encore revendiquer légitimement aujourd'hui l'épithète d'universel dans la lointaine filiation de Furetière, c'est parce qu'il reflète, à sa manière, les contradictions de son époque, parce qu'il montre le savoir rationnel se dégageant des discours hérités, des conversations, des lieux communs, parce qu'en un mot son discours dynamise constamment l'organisation statique de la connaissance et dénonce l'utopie d'un encyclopédisme total dans le temps même où, à la lumière d'une critique constamment en éveil, il en construit une représentation globale.
Ainsi conçu, défini, organisé et réalisé, le GDU parangonne parmi les plus grands monuments de la lexicographie universelle et tous les ouvrages qui visent à décrire exhaustivement le monde en en quadrillant par les mots et les phrases les différents secteurs et les diverses représentations. Le regard rétrospectif des lecteurs d'aujourd'hui, toujours plus nombreux et passionnés, ne manque d'ailleurs pas d'accentuer ce qui assure à ce document ses qualités prismatiques de réflecteur idéologique, conditionnant la possibilité d'une analyse spectrale du passé culturel, politique, artistique, scientifique, religieux, philosophique, idéologique, qui constitue notre patrimoine culturel. Le GDU réunit en un ensemble unique et irremplaçable des données factuelles et des méta-données axiologiques dont il est impossible de démêler les implications hors une connaissance précise de la sémiotique sociale du XIXe siècle, et de ses dictionnaires, et sans une juste appréciation du dessein propédeutique, éducatif et philosophique de Pierre Larousse. Dans la toile arachnéenne des renvois qui constitue la réticularité propre aux entreprises lexicographiques, le GDU assume une fonction toute particulière.
En effet, à côté du contenu directement informatif des notices, qui redonnent vie à des éléments égarés dans les labyrinthes de l'histoire politique, religieuse, artistique ou culturelle, le contenu latéral ou indirect, qui permet de saisir dans une formulation les traces d'un jugement d'époque, retient constamment l'attention des lecteurs que nous sommes. L'horizon de rétrospection des lectures ainsi faites construit une historicité discursive des notices et conduit à la perception d'effets de valorisation positive ou négative, constituant les indices d'une axiologie qui, dans la plupart des cas, échappe de nos jours à la conscience des usagers de l'ouvrage. Larousse revendique ici, comme en toute chose, le droit aux " situations tranchées ". C'est ainsi que le clivage célèbre de Bonaparte et Napoléon, destiné à " faire dresser plus d'une oreille ", et qui répartit la matière biographique et historique entre deux notices, jette sur l'histoire factuelle, comme sur la légende tramée par la littérature, un jour critique discriminant, que l'informatisation permet d'approfondir par la multiplicité des liens auxquels donne accès le clic droit de la souris sur n'importe quel élément linguistique de ces notices.
Par la diversité des objets abordés dans ses notices, et par l'engagement dont font preuve ces dernières, le GDU est ainsi le témoin d'un système du monde qui mérite aujourd'hui encore, non seulement la considération des chercheurs confrontés à des objets dont la représentation est donnée par les textes de l'âge classique et moderne, mais également celle des lecteurs de bonne volonté, amoureux de la langue, de détails, d'anecdotes et d'explications souvent délivrées cum grano salis… Les nouvelles technologies de l'information et de la communication ne pouvaient être ignorées dans l'exploitation des richesses de cet ensemble.
Les attendus de la réalisation
Le programme défini par l'auteur rendait déjà compte de la difficulté à organiser une telle diversité de champs d'investigation et de données. L'histoire s'y taille un domaine de première importance, et ce ne fut pas une des moindres difficultés de ce travail, au-delà des engagements de la rédaction, que de restituer aux faits leur véritable stature :
Une des parties les plus importantes traitées dans le Grand Dictionnaire, c'est l'histoire. Nous l'avons traitée avec l'impartialité la plus complète, en dehors de toute opinion préconçue, nous affranchissant, autant qu'il a été en notre pouvoir, de cet esprit systématique, ou de parti, qui dicte si souvent les jugements de l'historien […].
Au vu et au su de certaines notices célèbres, on peut naturellement se poser la question de l'impartialité réelle du lexicographe. Des articles comme Algérie, Cochinchine ou Madagascar montrent en lui un colonialiste engagé… L'attaque - en tous les sens du terme - de la notice consacrée à Marie-Nicolas Bouillet est d'une vigueur qui interdit la sage et calme objectivité d'une distance critique raisonnable. Mais il demeure constant que l'ouvrage est fondé sur une documentation visant à l'exhaustivité et traitée de manière à fournir des effets de sens non ambigus, ce qui est également perceptible dans le secteur connexe de la biographie. Dans cette perspective, Larousse pouvait envisager la géographie comme un autre secteur fondamental de la connaissance, dont il importait de permettre l'accès au plus grand nombre. La fondation historique de la France moderne que réalisaient les régimes politiques de Louis-Philippe, de la seconde République et du Second Empire devait s'accompagner d'une description de sa spatialité et de ses particularités en termes de provinces, de régions, de terroirs. Des notations minimales de l'ancien dictionnaire de Vosgien aux études contemporaines de Larousse de La France illustrée par Malte-Brun fils, puis aux volumes de la France pittoresque , c'est toute une manière d'envisager la place de l'homme dans son cadre géographique qui avait changé. Petits ou vieux, les Français consultant le GDU découvraient dans ses notices un ensemble d'études descriptives et analytiques sur la France et le monde, sur la France dans le monde et la réfraction du monde par la France.
Après avoir ainsi défini une certaine manière de concevoir le monde et de le représenter, manière qui comporte d'ailleurs ses limites, comme le marque par exemple l'article nègre, Larousse pouvait passer en revue l'ensemble des domaines scientifiques ayant bénéficié d'un traitement analogue. Cette liste faisait bien plus que dresser une cartographie des territoires occupés par le discours du lexicographe ; elle exposait les principes au nom desquels la critique du document, selon une méthodologie justement appliquée en linguistique, s'instituait en préalable obligé à l'analyse de son contenu :
Là où le génie de l'homme n'a pu encore réussir à sonder tous les mystères, nous n'avons pu que constater des résultats incomplets ; mais partout, du moins, nous avons signalé le point extrême qui marque la limite où le connu s'arrête, pour faire place aux hypothèses plus ou moins plausibles ; en sorte que le lecteur est certain d'avoir une statistique exacte, rigoureuses, de l'état actuel de la science. Parfois il ne trouvera qu'une ébauche, un dessin dont les formes ne sont pas encore accusées ; mais la reproduction en sera du moins fidèle et complète. Un ordre d'idées naît, un principe est en travail d'enfantement : nous ne pouvons que faire pressentir des conséquences, préjuger des résultats ou indiquer, d'une manière hypothétique, le rôle futur d'un système ou d'une découverte dont on est encore à étudier la valeur et l'importance ; trancher péremptoirement des questions aussi délicates nous paraît contraire à la tâche que nous nous sommes attribuée, comme au-dessus de la portée de notre esprit. […] Nous ne sommes pas, nous n'entendons pas être une école, une secte, un parti, une autorité ; nous ne dogmatisons pas, nous n'excommunions pas. […] Pénétrer dans chaque doctrine et faire ressortir l'idée qui en forme le centre et pour ainsi dire le noyau solide, tel est le but principal que nous nous proposons. Si nos opinions personnelles se laissent voir plutôt qu'elles ne s'accusent, si généralement nous ne formulons des conclusions qu'avec réserve et sobriété, c'est que nous voulons amener le lecteur, non à accepter un jugement tout fait, mais à prononcer lui-même en connaissance de cause ; c'est que nous nous fions à la lumière qui jaillira pour lui du choc des opinions contraires, et qui mettra également en évidence les côtés faibles des systèmes et leur véritable force.
Le langage ainsi conçu possède donc en lui, pour Larousse, la capacité de faire advenir en chacun le discernement critique et la finesse nécessaires à l'appréciation des arguments d'un scénario interprétatif. Larousse avait précédemment eu recours à l'image du scalpel ; c'est ici celle des flambeaux, lointaine réminiscence du mythe des Lumières, qui est employée pour signifier cet éclaircissement par le langage de la matière opaque du monde. À cet égard, nous avons eu l'occasion de souligner l'importance accordée par l'auteur au domaine de la littérature et des arts dans la conception d'ensemble de son travail lexicographique. On retrouvera, au terme de la préface, une identique expression d'intérêt, que l'on interprétera comme la marque distinctive la plus forte de l'entreprise de Pierre Larousse :
Pour les diverses parties que nous venons de passer en revue, nous n'avions pas à innover ; nous ne pouvions qu'améliorer. […] Mais ce qui constitue le côté véritablement neuf, original, du Grand Dictionnaire, ce qui lui imprime un cachet tout particulier d'intérêt et d'utilité, ce sont les innombrables articles de littérature et d'art dont nous allons donner un rapide aperçu, articles que le lecteur n'a jamais trouvé réunis dans un même ouvrage, et que nous ne sommes parvenu à élaborer qu'au moyen de recherches et d'études dont il serait difficile de se faire une juste idée. Si quelques omissions ont échappé à notre attention, tenue constamment en éveil sur tant d'objets à la fois, que l'indulgence de nos lecteurs nous le pardonne ; nous nous lançons les premiers, sans précédents, sans guides, dans cette carrière dont l'horizon se reculait sans cesse devant nos regards, et nous avons dû nous armer d'une constance à toute épreuve pour la parcourir, avec la seule ressource d'un travail incessant et de notre volonté. Il y a tout un monde qui, pour n'avoir jamais joui que d'une existence fictive, ne s'en impose pas moins à nos souvenirs et dont la vie imaginaire a laissé des traces ineffaçables dans notre histoire littéraire. […] Nous voulons parler des héros de romans, de poëmes et de théâtre, qu'anime une individualité bien autrement puissante que le prestige éteint d'une foule de noms qu'on trouve obscurément enfouis au fond de toutes les biographies. Est-ce que […] tous ces personnages si vivants, si originaux, dont le caractère se dessine avec une netteté si pittoresque, n'animent pas l'histoire littéraire d'un souffle plus puissant et surtout plus poétique que la biographie de tel ou tel général, préfet ou sénateur, ne donne de piquant et de relief au cadre des existences réelles ? […] Comment se fait-il donc qu'on n'ait jamais songé à tracer leur monographie, à faire, pour ces illustrations du monde de la poësie, ce que le moindre principicule a obtenu de nos biographes complaisants. C'est cet inexplicable oubli que nous venons réparer. Ces individualités si originales, si brillantes, et souvent si populaires, jouiront désormais du droit de bourgeoisie dans toute encyclopédie bien conçue, et nous croyons pouvoir affirmer que ce ne sont pas ces noms-là qu'on cherchera le moins souvent.
En face de ce programme déjà fort lourd, le pantagruélisme encyclopédique de Larousse ira jusqu'à oser une audace alors inédite, puisque - se substituant à lui tout seul à tous les régiments de dictionnaires biographiques - le lexicographe entendait faire du GDU un ensemble de références bibliographiques incontestables, une sorte de carrefour des œuvres indexées par leurs titres, qui permette de dresser des cartographies du savoir et de tisser des liens pour lesquels le médium électronique d'aujourd'hui semblait tout désigné :
Il est un autre domaine, infiniment plus étendu, neuf, encore inculte, mais qui est appelé à produire des fruits magnifiques, et dont nous avons entrepris la difficile exploitation.C'est peut-être la plus lourde partie de notre tâche, et nous avons dû nous en représenter sans cesse l'immense utilité pour ne pas être tenté cent fois de l'abandonner ; nous voulons parler de la bibliographie complète, de tous les temps et de tous les pays. Au nom même d'un auteur, dans un dictionnaire historique, on trouve quelquefois une appréciation superficielle, maigre et sèche, de ses œuvres ; quant aux critiques faites largement aux analyses consciencieuses rédigées en pleine connaissance de cause, il faut les chercher dans une foule d'ouvrage dont on ignore le plus souvent l'existence. […] Eh bien, nous avons recueilli tous ces documents épars ; nous avons étudié, analysé, toutes ces œuvres […] nous les avons tirées de leur obscurité relative et mises au grand jour dans notre ouvrage, où chacun les trouvera à l'ordre alphabétique de leur titre, avec une analyse détaillée qui en fait ressortir rigoureusement le plan, les qualités, les défauts, la pensée qui a présidé à leur rédaction […].
Ainsi, chaque fois que nous nous engagions dans la passionnante lecture de cet objet pyramidal qu'est le GDU, ne devions-nous pas oublier que l'information délivrée en ses colonnes n'est jamais totalement directe, et que celle-ci joue toujours des réflexions, des ombres et des échos que suscite le langage du maître d'œuvre et de ses collaborateurs ? Et - singulièrement par les exemples et citations alléguées dans leurs développements -, les discours exposés dans ses pages ne cessent dès lors de voir leur signification démultipliée en d'infinis prolongements jusqu'à nos présentes lectures. Certains des liens hypertextes proposés témoignent bien de cette fascinante polyphonie qui, sous des lignes distinctes - linguistique, encyclopédique, didactique et morale - conduit en chaque notice un discours parfaitement adapté au dessein philanthropique d'ensemble d'un ouvrage fondamentalement dédié à la bourgeoisie active, cultivée et capable d'intelligence critique.
Comme nul aujourd'hui ne saurait se targuer d'avoir lu le GDU dans son intégralité, et d'avoir indexé à sa lecture la multitude des domaines pris en charge par cette somme, une bonne version électronique de cet ouvrage devait permettre dans mon esprit d'escompter les bénéfices apportés par la plus-value paradoxale résultant de cette dématérialisation de son discours. En définissant chaque item lexical par l'ensemble de ses coordonnées à l'intérieur de l'ensemble du dictionnaire , et en autorisant ainsi de multiples parcours de lecture, l'informatisation du GDU faciliterait la compréhension du dessein poursuivi par Larousse, lorsque celui-ci expose en particulier toute la théorie des disciplines que le dictionnaire identifiera comme marques de domaines, d'administration à zoologie en passant par hautes mathématiques ou magies. Mais il en est bien d'autres encore qui échappaient à cette liste, comme architecture, coutume, mœurs, ou ethnologie. Et cependant le GDU, sous l'article Ethnologie, rend compte successivement de tous les ouvrages publiés entre 1800 et 1858, qui proposaient un tableau de classification des races humaines selon des critères physiques, notamment des mesures craniologiques. De même en ce qui concerne la sociologie… Arrêtons-nous un instant sur ce dernier terme qui figure comme entrée dans le GDU, avec ce commentaire : " le mot sociologie est nouveau et a été introduit par l'école positiviste ; mais la chose n'est pas nouvelle.En effet, la sociologie est la science de la société ; or la société c'est l'homme, et il y a longtemps que l'homme a commencé à s'occuper de lui-même " [t. xiv, p. 806 c] . Admirons ici la puissance démonstrative de l'enthymème… Car on notera qu'à l'heure de la disparition dans les cursus de la rhétorique taxinomique, la figuralité n'est jamais absente du dispositif explicatif standard mis en place par Larousse dans ses notices. Or, dès que l'on conçoit la rhétorique comme un art de l'invention, de la disposition et de l'élocution des arguments, on peut à juste titre envisager une rhétorique de l'article du GDU, que la métalexicographie moderne et l'analyse de discours aident à mieux concevoir, et sur laquelle il faut désormais s'attarder. Car l'informatisation devait aussi prendre en considération ce paramètre figural.
En effet, c'est d'abord par l'organisation logique des notices que se réalise la sémiotique des dictionnaires. Dans le cas du GDU, le dispositif choisi et régulièrement tenu tout au long de l'ouvrage propose une macrostructure alphabétiquement ordonnée et unifiée, puisque la nomenclature accueille par interclassement les mots du lexique français, les emprunts terminologiques, et les noms propres de personnes, de lieux, d'ouvrages, etc. Comme le soulignait Alain Rey en 1987, le GDU possède cette particularité que les noms propres y débouchent sur la description du monde et sur l'histoire… La microstructure de chaque notice obéit pour sa part à une stricte régularité. On distinguera ici les notices présentant un nom propre et celles qui traitent d'un élément commun de la langue (nom, verbe, adjectif, en général toutes parties du discours), car l'économie rédactionnelle ne peut être identique dans les deux cas .
La présentation des noms propres a recours aux critères ordinaires de définition que fournissent la chronologie, la géographie, la biographie. Des anecdotes, des jugements, des schémas, des cartes, des extraits de partitions musicales, enrichissent le contenu de la notice qui s'achève en donnant souvent une brève liste des œuvres de l'auteur, si l'entrée correspond à un créateur. Il est particulièrement fascinant de pouvoir slalomer entre les patronymes homonymes ou de suivre de véritables généalogies familiales dans les colonnes du GDU. Ainsi des douze colonnes au long desquelles se distribuent les Smith, de Thomas à Alexandre, ou des détails qu'égrènent les notices consacrées aux membres de la famille Chodkiewicz. Détails et anecdotes confèrent une consistance prenante à ces figures d'autres temps et d'autres lieux.
Les notices traitant d'une dénomination susceptible d'être appréhendée sous les traits d'une partie classique du discours présentent une organisation plus complexe et font montre de la rigueur avec laquelle le lexicographe et son équipe se sont acquittés de leur tâche, et n'ont pas démérité au regard et au juger des encyclopédistes. La vedette ou entrée de la notice est suivie de la variante éventuelle qu'elle peut recevoir, puis de sa caractérisation par une marque grammaticale, la prononciation sommairement transcrite parfois et l'étymologie complétant la présentation initiale. Le texte qui suit, articulé en paragraphes et en éléments séparés par des doubles barres, comporte jusqu'à quatre sections successives dans les cas les plus complexes :
1° Une section générale de linguistique tout d'abord, qui se déploie elle-même en deux sous-ensembles ; le premier analyse l'entrée et en donne l'interprétation, chaque effet de sens distingué étant assorti d'une définition spécifique. Des exemples forgés et des citations d'auteurs complètent le travail ; le second sous-ensemble, sémantique et formel, décrit des syntagmes ou des locutions, mais il interfère parfois avec le premier.
2° Une section plus proprement terminologique lui succède, qui réfère la forme-entrée à une marque de domaine et en circonscrit l'orbe d'usage. Le lexicographe glisse là assez souvent les valeurs sémantiques particulières de la vedette ou du syntagme dans lequel elle se réalise. On ne peut qu'être frappé ici par la richesse et l'étendue des domaines scientifiques, techniques et artistiques couverts par le GDU.
3° Une nouvelle section de linguistique, plus particulière, consacrée aux faits de syntagmatique (épithètes, périphrases, etc.), de paradigmatique (synonymie, antonymie) ou d'homonymie, qui donne accès à des renseignements de nature philologique.
4° La dernière section est consacrée à l'encyclopédisme proprement dit, qui reprend pour les développer les éléments constitutifs principaux de la section terminologique.
5° Éventuellement se trouve à la suite l'élucidation grammaticale d'une difficulté de langue.
Il y avait là une disposition solide, pérenne et structurante des formes explicatives qui, bien que le lexicographe n'ait pu avoir la pré-science des distinctions de la sociolinguistique contemporaine, permettait de souligner les divers phénomènes de variation dont témoigne pour lui le lexique, et qu'il revient à un dictionnaire d'expliciter à l'aide d'exemples choisis et de citations. Transcrites dans la terminologie d'aujourd'hui, ces formes permettaient d'isoler des variables de fonctionnement de la langue et des discours sur lesquelles le dictionnaire fait porter l'attention. Michel Glatigny a analysé cet aspect des choses et rappelle fort justement que c'est à partir " surtout de P. Larousse que l'utilisation de ces marques permettra d'ouvrir les colonnes des dictionnaires à des unités lexicales qui, naguère, paraissaient à la limite de la respectabilité sociale ou de la tradition centralisatrice. Avec le GDU apparaît par exemple le marqueur argot, promis à un tel avenir qu'il deviendra bientôt l'élément focal d'innombrables dictionnaires , et se multiplient, comme chez Littré, les indications diatopiques accompagnant des unités qui sont passées des répertoires de patois dans un dictionnaire général de la langue française ".
Larousse et ses collaborateurs se donnaient à l'évidence une méthode et un corps de doctrines afin de traiter les données d'un savoir qui se voulait universel et de convertir ces dernières en informations réglées par le format des notices, mais, non moins à l'évidence, ils s'autorisaient des libertés dans les techniques de la rédaction qui rendent difficiles aujourd'hui les tâches de balisage préalables à l'exploitation informatique de tout dictionnaire. Ajoutons que les modes de disposition typographique adjoignent à l'ensemble un supplément de difficultés, qui fait, par exemple, que le découpage de chaque page en colonnes homogènes s'avère impossible dans un peu moins de 1,9 % de l'ouvrage. Dans ce cas, l'image quadricolonne de la page se substitue au mode ordinaire de visualisation afin de préserver l'intégrité informative des tableaux, des schémas ou des tables statistiques.
Il y a là une limite de nature proprement sémiotique qui souligne la difficulté présente d'articuler de manière cohérente les deux modes de la " lexicographie " (forme du contenu) et de la dictionnairique (forme du contenant). Dans un ouvrage où l'illustration assume une fonction sémiotique et non seulement sémiologique qui va au-delà de la simple ornementation, il était absolument nécessaire que le lecteur moderne du GDU puisse simultanément avoir la rétroconversion du document (mode image en mode texte) grâce à un OCR amélioré, et la visibilité de sa source dans toute les particularités de ses illustrations (ceci est spécialement valable pour les tableaux linnéens qui parsèment l'ouvrage, lesquels sont significativement représentatifs des modes de représentation taxinomique du savoir que promeut le XIXe siècle). C'est ici une différence importante avec l'Encyclopédie de Diderot et d'Alembert, précédemment numérisée par les mêmes éditions Redon, qui présente les illustrations sous forme de planches séparées. L'intégration de l'image au texte constituait un défi.
Pour revenir au contenu même de l'ouvrage, je n'insisterai pas sur la liste des auteurs allégués et sur celle des sources reconnues. Il n'est que trop évident que cette litanie de références est incomplète, et qu'elle pèche doublement par son hétérogénéité : d'une part en juxtaposant anciens et contemporains, et en omettant nombre de figures artistiques, littéraires ou scientifiques qui font la gloire du GDU, d'autre part en gommant rétrospectivement pour nous tous les degrés et effets d'une échelle de valeurs qui était bien connue à l'époque de Larousse par les contemporains.… et qui n'avait pas besoin d'être explicitée, mais pour laquelle, aujourd'hui, il nous faut faire jouer des indices axiologiques directs ou indirects.
La recherche en plein texte, telle qu'elle est ici envisageable et réalisée par la vertu de l'électronique, permet de ramener dans nos filets bien d'autres références. Elle permet aussi de tenter un essai de reconstitution de cette échelle de valeurs grâce aux techniques de l'analyse de discours qui offrent la possibilité de détailler les mécanismes contextuels déterminant le sens et les effets de sens associés à l'occurrence de chacun de ces noms propres. C'est ainsi que Beaudelaire (sic), dont la gloire et le décès surviennent dans le cours de la conception, de la rédaction et de la publication du GDU, fait l'objet d'une notice mi-objective et mi-critique, dont le contenu se transmet par ricochet du tome 2 au tome 16. Cette notice donne à lire en explicite et en implicite tout l'univers de sens qui s'attache alors au contexte esthétique dans lequel baignent la personne et l'œuvre de Baudelaire. Le renvoi à l'article Fleur pour commenter le volume des Fleurs du Mal ajoute à l'ensemble le détail d'une analyse littéraire grâce à laquelle peuvent être rétablies de nos jours les perspectives alors contemporaines de saisie du sens et de la valeur de ce recueil.
Mais il est aussi d'autres objets qui font apparaître toutes les difficultés - heureusement surmontées dans leur plus grande partie - auxquelles se sont heurtés les rédacteurs du dictionnaire. Ce sont tout d'abord les marques du système abréviatif, dont la diversité ne peut éviter l'écueil d'une plurivocité que la lexicographie scientifique d'aujourd'hui condamne comme un défaut sémiotique. La seule liste des abréviations signale l'amplitude des domaines techniques et scientifiques abordés par les rédacteurs, puisque l'on sait d'emblée, grâce à elle, que les champs de l'Alchimie, de l'Arquebuserie, de l'Erpétologie, de l'Helminthologie, de la Linguistique ou de la Trigonométrie, aussi bien que ceux de la Charcuterie, de la Mégisserie, ou de la Teinturerie, seront représentés, analysés et illustrés dans le dictionnaire. Mais elle porte aussi la marque des difficultés d'harmonisation qui en découlent puisque nombre de ces marques abréviatives peuvent référer à plusieurs objets ou domaines distincts.
Une observation similaire peut être faite au sujet de la liste des abréviations proprement grammaticales. Cette liste est peut-être même encore plus parlante dans son hétérogénéité, qui n'est alors que l'expression du désir de formuler - de manière économique et sans équivoque - la dénomination et la caractérisation des constituants fondamentaux de la grammaire. Identifier minutieusement et clairement les parties du discours, c'est prendre le parti du discours qui permet de rendre compte de l'organisation du monde et de l'univers dans et par l'ordre du langage. Larousse a certainement retenu ici les leçons de la sémiotique du Dictionnaire universel de la langue françoise, avec le Latin, de P.-C.-V. Boiste, et, avec lui, la filiation du Dictionnaire de Trévoux, auquel son positivisme laïc et son républicanisme d'opinion confèrent désormais une dimension explicitement encyclopédique sous les couleurs d'une analyse fondée sur l'observation la plus scrupuleuse - à l'intérieur d'une certaine épistémologie de la grammaire - des pouvoirs analytiques du langage, qu'il s'agit dès lors d'objectiver dans un absolu de référence. Mais, pour qui veut rendre un compte précis des informations contenues dans le GDU, ces incohérences rendent obligatoire un travail de désambiguïsation des abréviations.
Les contraintes techniques
Cette disposition réfléchie, avec ses apories mêmes, que l'électronisation d'aujourd'hui rend plus visible jusque dans ses limites, plus lisible, plus démonstrative aussi dans son souci informatif, concourt pour une large part au succès de diffusion du GDU. Qu'il soit de langue, de choses, encyclopédique, technique ou universel, le dictionnaire imprimé est en effet cet ouvrage de référence auquel le consultant s'adresse pour l'élucidation d'une difficulté, à la lumière de laquelle peuvent éventuellement être envisagés par la suite d'autres parcours de lecture ou de consultation. À cet égard, dans sa forme papier originelle, l'ouvrage de Pierre Larousse se veut bien ce résumé panoptique, classé et alphabétiquement ordonné de la connaissance universelle du XIXe siècle, qui permet de mettre toute une bibliothèque condensée à la disposition du public : les dix-sept volumes rappelés en introduction sont là pour en témoigner.
Le texte imprimé qui réalise ce projet en permet indifféremment une lecture en continu, au fil de sa linéarité - et d'aucuns y liront un roman -, ou une consultation en discontinu puisqu'il est muni d'une structure explicite (divisions alphabétiques, partition linguistique et encyclopédique des notices, etc.) - et d'autres chercheront ainsi la simple réponse ponctuelle à une question, avec éventuellement les ricochets successifs que procurent les deux suppléments et leur cohorte de précisions, mises à jour ou rectificatifs…
Permettre un accès automatique à ces informations, afin d'en démultiplier la polyphonie et de déployer l'hypertexte dans lequel elles se situent, revenait en conséquence à dégager de la structure physique proprement dite du dictionnaire papier la structure logique correspondante, afin de réaliser entre les deux une interface logicielle qui transforme l'information linéaire véhiculée par le discours des notices en une base de données textuelles susceptible de donner accès à toutes les occurrences dans le texte du phénomène indexé par une requête (mot, expression, mots qui sont marqués comme termes de droit ou de botanique, comme appartenant au registre bas ou populaire, unités qualifiées de locution proverbiale, adverbes en ?ment, noms définis comme étant des espèces d'action, etc.). Cette dématérialisation numérique est la condition d'accès primordiale à une nouvelle philologie de la lexicographie.
Compte tenu des spécificités de l'œuvre de Pierre Larousse, et en raison même de l'absence très dommageable d'indexation sérieuse des entrées dont faisait preuve la reproduction des exemplaires dépareillés de Gallica, deux raisons essentielles militaient d'emblée puissamment en faveur de la diffusion depuis longtemps attendue du GDU sous une nouvelle forme électronique qui ouvre l'accès automatique à la richesse de son contenu. Le premier argument tient à un travail sur l'usage même des mots : il y a bien là du lexique, une lexicologie, une lexicographie en cours d'élaboration scientifique, et par conséquent une métalexicologie. Le second est lié aux difficultés de la consultation actuelle du GDU imprimé : la nature dictionnairique est matériellement dépendante de l'état matériel de son support. Qui n'a jamais vu au rayon des usuels d'une bibliothèque le lamentable spectacle d'une collection de GDU réduite en fragments jaunis et pulvérulents ?…
Dans la perspective de l'étude de la langue française moderne, et de ses produits culturels dérivés artistiques, littéraires ou scientifiques, comme dans la perspective d'un approfondissement des méthodes lexicographiques, cette base devait permettre une consultation enrichie du dictionnaire en offrant l'accès à l'exhaustivité de ses données et de sa documentation complémentaire. Comme il a été rappelé précédemment, Larousse soulignait dès la préface de son ouvrage, le caractère résolument linguistique de son ouvrage :
Le Grand Dictionnaire universel du XIXe siècle étant, avant tout, le dictionnaire de la langue, la partie lexicographique a reçu des développements qu'on chercherait vainement ailleurs, et qui se suivent dans un ordre logique, clair, méthodique, que tous les dictionnaires avaient trop dédaigné jusqu'à présent : sens propres, sens par extension, par analogie ou par comparaison, sens figurés purs, sont nettement déterminés par des exemples qui font rigoureusement ressortir les nuances et les délicatesses des diverses acceptions ; chaque mot trouve son historique tout tracé par son étymologie, sa formation, et les vicissitudes de sens qu'il a subies pour arriver jusqu'à nous, vicissitudes rendues sensibles par des exemples empruntés à nos vieux chroniqueurs, aux fabliaux, aux trouvères, aux auteurs du XVIe siècle, à ceux du XVIIe et du XVIIIe, et enfin, et surtout, aux écrivains de notre temps. Un dictionnaire du XIXe siècle ne doit-il pas s'attacher de préférence à reproduire la physionomie de la langue au moment actuel ?
Ne nous méprenons pas sur le sens de cette revendication en comparaison avec les objectifs affichés presque simultanément par Littré. Larousse plaidait contre l'érudition des cuistres et revendiquait une portée immédiatement pratique à ses discours. Le citoyen formé par l'école et conformé par elle aux besoins de la société contemporaine devait y trouver immédiatement tout ce qui lui permettrait de définir sa position sociale par l'habileté dont il ferait preuve dans l'utilisation du langage et le maniement des discours : Ces études rétrospectives [de Littré], cette sorte de philologie archéologique peut plaire aux savants et aux linguistes, mais elle n'offre qu'un médiocre intérêt pour les gens du monde, qui veulent connaître avant tout la langue telle qu'elle existe aujourd'hui…
Le propos était dépourvu d'ambiguïté : énonciateur actif, parfois provocateur, toujours responsable et soucieux de maïeutique sociale, le lexicographe qu'envisageait Larousse dans le GDU devait pousser sa description des usages jusqu'aux discours sociaux du temps même où il écrivait. L'aphorisme cinglant de Francis Ponge : " On peut se moquer de Littré, mais on doit user de son dictionnaire " (Fragments métatechniques, 1922), n'est pas loin ici de revenir en mémoire. Car, aux réserves d'ironie près, le même propos pourrait être tenu aujourd'hui au sujet du GDU.
Si, dans un premier temps, compte tenu des contraintes techniques liées à la gestion des images, et malgré l'affinement de ses méthodes, l'indexation ne permet qu'une vision partielle de toutes les richesses du GDU, en permettant de lier aisément en surface textes et images associés, on a pensé à envisager dans un second temps de peaufiner ce travail en profondeur en faisant de l'œuvre de Larousse le centre de référence à partir duquel tous les composants de sa documentation seraient disponibles dans quelque site www que ce soit. Et évaluables. Il serait alors possible de rassembler :
a) les notes critiques de la préface concernant les objectifs et les méthodes du dictionnaire, sa réception, le lexique recensé,
b) toutes les notes bibliographiques renvoyant à ces monographies comparatives de mots, qu'on peut trouver dans les ouvrages similaires de Napoléon Landais, Louis-Nicolas Bescherelle, Dupiney de Vorepierre, Prosper Poitevin ou Émile Littré, toute " cette foule de dictionnaires qui, depuis vingt ans, se sont échappés de nos grandes boutiques de librairie, pour s'abattre comme des nuées de sauterelles dans nos bibliothèques et dans nos écoles ", ainsi que l'écrivait Larousse lui-même…
c) les textes littéraires associés résidant dans d'autres bases comme ARTFL, ABU et Frantext,
d) et enfin la documentation des textes littéraires ou techniques, de tous les autres dictionnaires techniques contemporains, ayant pu servir de sources à Larousse et ses collaborateurs.
Il serait dès lors également possible d'envisager un hypertexte qui relie tous ces documents en mode dynamique rendant enfin pleinement justice aux différentes dimensions de l'œuvre de Larousse. La valeur et l'intérêt d'un dictionnaire, qu'il soit encyclopédique, universel ou de langue, ne se renferment pas dans l'objet lui-même ; ils sont tout au contraire relatifs à l'ensemble sériel des ouvrages analogues dans lequel cet item trouve sa place. Second argument, du point de vue pratique de l'accès au dictionnaire en lui-même, on rappellera encore que la matérialité du GDU devient chaque jour de plus en plus problématique. En effet, la consultation et l'étude de cet objet sont gravement hypothéquées par la lisibilité d'une typographie minuscule et serrée, jointe aux conditions techniques d'impression du GDU sur un papier rapidement acidifié ayant mal résisté à l'épreuve du temps. On observe généralement aujourd'hui qu'une année de consultation en usuel du GDU dans quelque bibliothèque publique que ce soit, suffit à rendre inutilisable une série complète. Or les tirages originaux du GDU ne sont pas en nombre infini.
Ces deux handicaps sont en principe réduits par l'informatisation. La réédition de l'ouvrage par les éditions Slatkine (1975), qui pensait améliorer la lisibilité et la conservation de l'ensemble par un léger accroissement des corps de la typographie, a pu prétendre un moment lutter contre ce défaut de lisibilité. Mais la première version électronique du GDU, réalisée par les éditions Champion, qui s'est appuyée sur cette réédition, n'a fait que mettre un peu plus en évidence le défectueux paradoxe d'une telle pseudo-amélioration. En effet, l'agrandissement des caractères n'a - semble-t-il - qu'augmenté les défauts d'impression que l'œil humain était capable de neutraliser sur le papier, mais qu'un OCR même sophistiqué, comme aujourd'hui, continue à peiner pour corriger ou rectifier. Ce type d'OCR irréfléchi a donc livré plus souvent des fautes ou des inexactitudes de reconnaissance, même après de longs entraînements.
Pour notre compte, après avoir dû procéder à une numérisation fine en mode image à très haute définition, il nous a fallu nous contenter dans l'instant présent d'une réduction à 300 dpi (point par pouce) de cette reproduction pour qu'un dévédérom ou une base en ligne du GDU permette de disposer commodément de l'intégralité du dictionnaire sous une forme homothétique de l'original, matériellement dégrevée des risques d'acidification ou de pulvérisation du papier, et plus maniable que l'ensemble musculairement exigeant des dix-sept volumes. Là encore, il a fallu trouver un compromis entre la taille, le poids et la lisibilité des documents reproduits, en fonction de leur statut sémiotique, et des contraintes d'indexation qui en découlent. Comme le rappelait naguère T.R. Wooldridge, informatiser un dictionnaire, c'est en rendre le contenu accessible sur un support électronique, et par conséquent substituer à la structure narrativo-discursive de la version sur papier une structure logique entièrement et rigoureusement définie. François Rastier, aujourd'hui, évoque la dématérialisation numérique du texte, et la remise en question de l'opposition du texte au discours dans la tradition philologique . Ce qui a rendu la tâche plus délicate, dans le cas du GDU, c'est la complexité sémiotique même de l'ouvrage. Lorsqu'on définit cet ouvrage comme un roman de la langue, on ne croit généralement pas si bien dire, car il y a dans le GDU cette profusion, cette générosité, ce souffle, cette dynamique et cette énergie qui - pour prendre des repères français des XIXe et XXe siècles - caractérisent la Comédie humaine, les Rougon-Macquart ou les Hommes de bonne volonté… Entre Balzac, Zola et Jules Romains, Larousse et ses collaborateurs ne déméritent pas. En dépit de l'alignement alphabétique des notices du GDU et en raison même des multiples liens susceptibles d'être tissés d'une notice à l'autre, l'œuvre de Larousse donne à observer toute une chaîne d'intrigues diverses qui se trament dans le tissu serré des faits objectifs, attestés, vérifiables et des anecdotes plus ou moins romanesques, mais déjà instructives à ce seul titre ! On conçoit, dans ces conditions, qu'une informatisation réussie de cet objet n'ait pu ressembler que de fort loin à des opérations analogues réalisées sur ces objets du même nom et pourtant si peu similaires que sont les dictionnaires de langue ou qui se croient ou se veulent tels. Traditionnellement, les travaux préparatoires menant à l'informatisation du document conduisent à identifier trois sortes différentes d'objets : 1° Des objets textuels : en vertu de sa circularité le dictionnaire électronique doit fonctionner de sorte que, d'une part, soit rendu possible l'affichage immédiat de n'importe quel article sélectionné, et que, d'autre part, à partir de n'importe quel mot plein l'article correspondant puisse être atteint et affiché. Un progiciel capable d'indexer automatiquement les formes simples (lemmes) auxquelles se rapportent les formes construites des signes lexicaux est donc ici nécessaire pour permettre le renvoi du type à une pluralité d'occurrences et de lieux (allions, par exemple vers aller et allier), et inversement. 2° Des balises métatextuelles susceptibles d'isoler tous les types d'informations contenus dans le dictionnaire : mots vedettes, codes grammaticaux, prononciation, étymologie, antonymie, synonymie, homonymie, numération des sens, marqueurs sémantiques, stylistiques, indicateurs de domaines, définitions, exemples isolés, exemples concaténés, locutions, idiotismes, syntagmes figés, etc. À chaque type doit correspondre une valeur spécifique unique. 3° Un objet logique, enfin, indifféremment dénommé " champ " ou " portée ", circonscrivant une partie de la définition, grâce auquel se définissent des possibilités de navigation interne interdites lors d'une banale lecture linéaire du document papier. Si l'on veut par exemple savoir quels sont les sens de tel ou tel vocable - Aquarelle, Honneur, Turpitude, etc. - qu'illustre tel ou tel écrivain, il est nécessaire de relever toutes les occurrences de ce vocable dans le dictionnaire en question et de croiser cette liste avec la table des noms d'auteur dans laquelle le nom propre choisi - Boileau, Prévost, Vigny, etc. - aura été indexé à fin de sélection automatique. Le dernier ne présente en apparence aucune difficulté ; les deux premiers, quant à eux, sont des patronymes qui renvoient à une infinité de personnages, parmi lesquels - seuls en l'occurrence - Nicolas (Despréaux) et Antoine-François (d'Exiles) nous intéressent. Comment, à partir de ces difficultés patronymiques liées à l'adressage d'une notice, constituer une classe logique homogène ? Dans le cas de l'informatisation du GDU les difficultés techniques et scientifiques étaient donc au moins triples : - D'une part, les procédures automatiques de reconnaissance optique de caractères s'avéraient encore insuffisamment exactes sur des documents de grande taille pour assurer une justesse de lecture quasi absolue, hors de laquelle l'informatisation perd tout intérêt. Des études ont effectivement montré qu'une saisie optique était et reste peu performante pour un grand volume de données : plus le volume de données à saisir est grand, plus la qualité de la saisie baisse (voir entre autres M. Olsen & M. McLean 1993 ). En outre, la saisie optique, comme la saisie manuelle simple, est très coûteuse en temps de correction (manuelle ou assistée par ordinateur), puisqu'il faut toujours relire tout le texte obtenu et que cette relecture ne peut pas garantir le même degré d'exactitude que la comparaison de deux saisies. Mais il faut aussi tenir compte du fait que, pour obtenir un document exploitable proprement et sûrement, toutes les marques de balisage XML des propriétés typographiques du texte ne peuvent être introduites dans celui-ci qu'au terme de ces relectures et corrections. La tâche de reproduction du document - image ou texte - est donc double puisqu'elle implique à la fois le texte comme chaîne de caractères visuels et le balisage XML. - D'autre part, une saisie manuelle du texte et une numérisation distincte de l'iconographie polymorphe qui l'accompagne se heurtait immédiatement à la taille du GDU. Pour réaliser cette saisie, il aurait fallu constituer deux ou trois équipes de claviéristes spécialisés exécutant chacune une saisie intégrale du texte du dictionnaire ; il aurait fallu ensuite procéder à un alignement comparatif de ces versions afin de trouver automatiquement la majorité des fautes. Une vérification ultérieure des hapax aurait enfin eu pour effet de parachever cette détection des erreurs et de rapprocher asymptotiquement de zéro le pourcentage des incorrections de transcription. Mais, quoique cette procédure soit désormais la norme en matière de saisie textuelle, puisqu'elle garantit le meilleur taux de correction, elle s'avérait économiquement et temporellement trop coûteuse dans le cas d'un grand volume de données. En outre, lorsque ces données sont elles-mêmes rendues complexes par la sémiotique - textuelle et iconographique - du document, ce protocole devient vite inopérant. - Il restait alors la possibilité d'une numérisation optique en mode image seulement, puisque l'on dispose aujourd'hui pour cela de logiciels de grande qualité. C'est la solution qui a été retenue ici. On aurait tort, cependant, de croire que le choix de cette solution a permis la résolution rapide et économique de tous les problèmes afférents à l'informatisation du GDU. En effet, quiconque, d'une part, a consulté l'ouvrage de Larousse s'est immédiatement rendu compte de la difficulté de lecture que constitue une présentation à quatre colonnes par page ; quiconque, d'autre part, s'est essayé à numériser une image s'est aussi rapidement aperçu de l'obstacle que le poids et la taille d'une image représentent pour l'archivage, la transmission et l'exploitation. Dans le cas du GDU, les difficultés majeures rencontrées tenaient à la taille et à la lisibilité des caractères typographiques, mais aussi aux caractéristiques des gravures et des lettrines, ce qui a déterminé à travailler non en noir et blanc mais en niveaux de gris sur un fond de papier parfois jauni, avec - comme je l'ai rappelé plus haut - une résolution finale égale à 300 dpi. Afin d'améliorer la lisibilité à l'écran et d'éviter de constantes remontées ou descentes d'" ascenseurs " (ces curseurs à droite des documents qui permettent d'y circuler plus rapidement), hormis le cas des pages présentant des tableaux complexes, il a également été décidé de substituer un monocolonnage informatique au pluricolonnage de la page papier, en gardant cependant le lien direct avec les illustrations lorsqu'il s'en trouvait. La lecture à l'écran s'effectue ainsi en continu, occasionnant moins de fatigue oculaire et intellectuelle. Une fois ces diverses opérations techniques effectuées, deux exigences se sont fait jour et ont dû être satisfaites. Celle du balisage et celle du découpage des unités informatives à partir desquelles les requêtes pourraient être formulées. C'est en effet à la seule condition d'une indexation aussi précise que possible que l'historien, le grammairien, le littéraire, l'esthéticien, le géographe, le physicien, le mathématicien, le biologiste, le chimiste, le philosophe, le musicien, le musicologue, l'historien de l'art et des cultures, comme l'anthropologue, l'ethnologue ou le psychologue, et bien d'autres spécialistes ou amateurs, ainsi qu'il a été rappelé plus haut, peuvent débusquer dans le GDU les réseaux de cohérence, de convergence ou d'incohérence qui caractérisent cet ensemble et le singularisent au milieu de la production ambiante. D'où naîtront d'inépuisables sources de réflexion et de meilleures conditions d'appréhension des systèmes de valeurs ayant conditionné le dix-neuvième siècle. Il a donc fallu satisfaire aux exigences relatives à la structuration de tout texte lexicographique, la définition d'une macrostructure, d'une microstructure, et d'une mésostructure, qui sont les trois niveaux d'organisation sémiotique auxquels prétend une notice de dictionnaire. Ce qui m'a conduit à procéder, du point de vue de la macrostructure, à la délimitation par tomes et colonnes puis à l'indexation la plus scrupuleuse et exacte des vedettes et sous-vedettes du dictionnaire, soit plus de 126 000 noms propres et près de 152 000 noms communs, afin de pouvoir proposer une interrogation ciblée sur ces premiers éléments. Puis à procéder également, du point de vue de la microstructure, à la délimitation des lignes des articles - celle des paragraphes pouvant relever de la mésostructure - ainsi qu'au balisage des catégories grammaticales des vedettes, à la délimitation et à l'uniformisation récursive des autres champs informationnels (marque d'usage, définition, synonyme, exemple, etc.). À cet égard, l'OCR automatique, encore assez rudimentaire, fourni avec chaque notice, mérite certainement d'être amélioré. S'il permet de convertir automatiquement en mode texte l'essentiel du contenu des notices, il ne peut en revanche, évidemment, prendre en considération les différentes sortes d'illustrations sémiotiques intégrées aux dix-sept volumes (figures, schémas, portées musicales, etc.). Mais, même avec ses limites et ses imprécisions actuelles, l'OCR mis en œuvre répond néanmoins aux attentes concernant le gain de temps et l'efficacité de consultation, un logiciel d'interface offrant la possibilité d'afficher conjointement à l'écran l'article consulté en mode image et en mode texte. On vise désormais à trouver des heuristiques susceptibles d'améliorer la précision et la justesse de cet OCR pour que les résultats obtenus ne fassent plus apparaître que des erreurs en proportion inférieure à 0,01 %. Nous espérons que ces aménagements facilitent aujourd'hui l'utilisation polyphonique d'une telle somme de savoir. Si quelques éléments prévus à l'origine dans l'ergonomie générale du produit ne sont pas encore directement perceptibles et utilisables dans la présente version électronique du GDU - je pense en particulier aux liens hypertextes qui doivent associer certains éléments de la présentation historique et lexicographique du GDU aux notices mêmes de cet ouvrage - il est envisagé de donner au début de l'été 2003 une seconde version qui intégrera cette facilité supplémentaire. À un premier niveau de responsabilité scientifique, les ouvrages anciens numérisés doivent être d'une irréprochable fidélité philologique : seule l'exploitation d'images textuelles garantit cette conformité, et je suis heureux que ce nouveau mode d'appréhension ait pu être testé et utilisé avec efficacité dans le cas du GDU. À un second niveau d'exigence technique, les outils issus de l'informatique méritent d'être mis à jour, améliorés et constamment soumis à la question des bénéfices (intellectuels !) que l'on peut tirer de leur utilisation. Demain Bien avant que l'idée pantagruélienne d'une navigation hypertextuelle totale fût envisageable au XIXe siècle, malgré les indices, répertoires et tables analytiques dont l'érudition n'avait cessé de se munir depuis la Renaissance pour s'immerger dans l'immensité d'un savoir en constante expansion, l'intitulé du GDU ne pouvait être qu'une invite à réaliser un idéal objectif d'interdisciplinarité critique et féconde et c'est probablement dans cette perspective que pareille dénomination fut envisagée. À la vérité, pour exploiter désormais toutes les richesses mises à disposition par cette nouvelle présentation du GDU, pour sonder efficacement aujourd'hui les abysses de connaissance renfermés dans ses 96 144 colonnes, et pour en pénétrer tous les replis que dissimulent les partis pris et le sens de la polémique inhérents au maître d'œuvre, il faudrait réunir une abbaye de Thélème dont les membres auraient l'expertise historique et scientifique des différents secteurs couverts par ce dictionnaire. On pourrait attendre d'une telle réunion qu'elle propose la définition des caractères les plus marquants des différents secteurs du savoir abordés par Larousse, et qu'elle expose une réflexion sur les enjeux épistémologiques, culturels et sociaux propres à chacun de ceux-ci, permettant ultérieurement d'envisager l'articulation de ces caractéristiques en un tout cohérent, à l'instar du dictionnaire lui-même. Grâce à l'informatisation de cet ensemble, il relève désormais de la responsabilité individuelle et de l'intelligence de chaque consultant du GDU de constituer ces réseaux de significations et de valeurs. En rassemblant, en organisant et rationalisant tous les liens possibles du GDU avec les données contenues dans les entreprises similaires de dictionnaires informatisés, tels ceux qui composent le GRAND ATELIER HISTORIQUE DE LA LANGUE FRANÇAISE [Ménage, Académie, Féraud, Guizot, La Curne, etc.], on démultipliera ces réseaux et l'on accroîtra le bénéfice que l'on peut tirer de leur comparaison. En ce qui concerne les dictionnaires de langue ou encyclopédies non encore informatisés, ou dont l'informatisation est en cours, tels le Dictionnaire de la conversation rédigé sous la direction de W. Duckett (1841 et 1867), et le Dictionnaire général de la langue française de Hatzfeld, Darmesteter et Thomas (1890-1900), la comparaison de leurs notices sous les deux aspects encyclopédique et linguistique ne manquera pas d'être stimulante et révélatrice, puisqu'on peut considérer que le GDU s'est donné comme défi de réunir ces deux postulations en un seul ouvrage, et qu'il lui a donc fallu trouver le moyen de concilier sous une notice des perspectives relevant d'exigences bien distinctes. L'accès automatique à l'information contenue dans ces divers documents servira de stimulateur pour l'exercice de l'analyse. Lorsqu'on envisage le début du XXIe siècle, et l'appétit de connaissances qui le caractérise, cette informatisation du GDU n'est-elle pas au fond une manière symbolique mais hautement efficace de réactiver pour nous les richesses léguées par le XIXe, et de conférer in extremis à la transition du XXe une vertu thaumaturgique de préservation et de démocratisation des archives que ce dernier siècle - le nôtre - n'a pas toujours su rendre perceptible sous ses formes heureuses ? À cet égard, puisque le siècle de Larousse - qui est aussi celui des dictionnaires - fut également le siècle des correspondances entre les arts, des échanges entre les sciences, de la culmination des utopies et des rêves palingénésiques, il n'y aurait guère d'incohérence à voir dans l'électronisation du GDU l'instrument qui permet aujourd'hui de galvaniser la chaîne de ce savoir et qui fait renaître à nos yeux tout un monde d'êtres, de choses et d'idées qui - pour oubliés qu'ils soient - ont constitué les moments et les lieux du développement de notre culture moderne. À l'endroit de l'incuriosité et des procrastinations dans lesquelles se complaisent les usagers de clichés paresseux, cette facilité technologique, soutenue par un dessein philologique et une ambition gnoséologique, pourrait bien être le meilleur moyen de faire la preuve que le siècle liminaire d'un nouveau millénaire a su prendre en charge pour la faire fructifier toute la richesse d'une conception folle et cependant raisonnée qui naquit un jour, peu avant 1840, dans l'esprit d'un jeune instituteur ycaunois. Un jeune homme de province, moins Rastignac que Louis Lambert, ébloui par tous les trésors que lui révélaient les bibliothèques et institutions dont il hantait les salles à longueur de journées, et qui mettait toute son énergie à en réaliser - par une nocturne alchimie - la compilation puis la synthèse critique. Un homme jeune qui, par volonté et abnégation, par enthousiasme et décision, choisit au prix de sa vie d'offrir à ses contemporains et à la postérité toute une somme de savoir raisonné et engagé. Toute une connaissance effectivement encyclopédique qui méritait bien qu'un jour les techniques modernes d'accès automatique à l'information permissent d'en apprécier le ductile feuilleté et d'en parcourir tous les espaces exponentiels, dans une version électronique que l'on peut espérer bientôt plus fiable et plus performante encore, si l'on songe notamment aux possibilités d'automatisation d'un OCR exact que le présent éditeur scientifique développe actuellement en étroite collaboration avec le laboratoire ATILF, UMR 7118 du CNRS.
