Retour au départ


Chronique

Le XIXe et recherches sur Internet

1. Balzac



La présente chronique est est divisée en deux parties. La première, que les habitués d'Internet pourront sans inconvénient sauter, est destinée à ceux qui le pratiquent depuis peu. Elle présente un certain nombre de considérations d'ordre général ainsi que quelques conseils pratiques. La deuxième partie, comme il se doit en cette année du bicentennaire, est consacrée à un compte rendu d'un certain nombre de sites Balzac.

Une première constatation : Internet, c'est l'anarchie des informations. Tous les jours des milliers de sites nouveau sont créés à travers le monde. Tous les jours il en meurt autant. Le site qu'on trouvait merveilleux hier a déménagé aujourd'hui ou, pis encore, celui qui l'a créé s'est lassé de sa création et a plié bagage sans laisser de trace. Comment et pourquoi naviguer dans les zones du cyberespace ? Dans ce chaos cybernautique il existe des perles précieuses, des sites exquis créés par des spécialistes ou des amateurs passionnés qui donnent des présentations multi-média de sujets qui leur tiennent à cœur. À titre d'exemple, je pense au Maldoror (http://www.maldoror.org/) de Michel Pierssens où le plaisir visuel s'ajoute à la découverte intellectuelle. Mais comment découvrir de tels sites ? Premier conseil : visiter le site http://www.copernic.com/ et télécharger le logiciel Copernic (gratuit). Comme on le sait, toute recherche sur Internet se fait à l'aide d'un moteur de recherche tel celui d'Excite (http://www.excite.fr/), d'AltaVista (http://www.AltaVista.net/) ou de Yahoo (http://www.yahoo.fr). Copernic présente le gros avantage de mener de front, de manière simultanée, des recherches à l'aide de douze moteurs de recherche, de consolider les résultats les plus probants et de les présenter sous une forme de consultation aisée et agréable. Finie la situation cocasse où l'on obtient 20 223 résultats pour une seule requête. Copernic n'en présentera qu'une soixantaine tout au plus et toujours les plus sûrs.

Dans un article publié dans les pages de Dix-neuvième siècle en novembre 1997(1), l'auteur du site Maldoror a donné une présentation magistrale des possibilités offertes aujourd'hui par Internet pour les recherches littéraires sur le XIXe siècle. Dans la mesure du possible je ne reviendrai pas sur les questions évoquées dans l'article de mon collègue de Montréal, sauf pour réitérer la mise en garde émise à propos de la qualité des textes électroniques que l'on trouve sur Internet(2). S'il est vrai que la « Toile » facilite une véritable démocratisation du savoir, il est aussi vrai qu'elle permet la circulation de textes dont le mieux que l'on puisse dire est qu'ils sont de paternité de douteuse. Je me contenterai de deux exemples rapides que l'on trouve sur le site ABU (http://cedric.cnam.fr/ABU/), site qui dispose sans doute du choix le plus large de textes français en accès libre. Il s'agit d'Adolphe de Benjamin Constant et de La Fille aux yeux d'or de Balzac. Non seulement le texte d'Adolphe est-il établi d'après une édition moderne sans aucune prétention scientifique, il est amputé d'un élément structural fondamental, soit le cadre narratif ! Le responsable de cette édition électronique a pris l'Avis de l'éditeur, la Lettre à l'éditeur et la Réponse à cette lettre pour des éléments paratextuels ! Quant à La Fille aux yeux d'or, Daniel Durosay affirme, dans la notice, s'être servi de l'édition Furne comme texte de base. Or, il n'en est rien! Un sondage rapide révèle quantité de divergences d'avec le Furne... Là encore nous avons affaire à un texte établi à partir d'une édition moderne sans que l'on puisse découvrir laquelle. Et si des problèmes de cet ordre de grandeur existent pour ces deux textes on peut être quasiment certain qu'il en existe une quantité d'autres dont personne ne s'est aperçu jusqu'ici. Par ailleurs, comme le texte électronique sert rarement à une lecture à proprement parler, il y a de fortes chances pour que ces infirmités passent inaperçues.

Heureusement il existe un certain nombre de sites où l'on peut avoir confiance en les informations fournies à propos des textes, même si l'on n'approuve pas forcément le choix d'édition saisie. Le serveur Frantext (http://zeus.inalf.cnrs.fr/frantext.htm) et son homologue américain, l'ARTFL (http://www.lib.uchicago.edu/efts/ARTFL/databases/TLF/) propose l'ensemble des textes saisis par l'Institut national de la langue française (soit plus de 3 000 textes et plus de 150 millions de mots). Malheureusement ces textes ne sont pas en accès libre — c'est-à-dire on ne peut les télécharger afin de les traiter à l'aide d'un puissant logiciel de concordance et d'analyse lexicométrique comme l'Hyperbase d'Étienne Brunet, par exemple (http://134.59.31.3/~brunet/pub/commande.html). D'autre part, la consultation est loin d'être aisée, car elle suppose des connaissances que seul possède l'usager expérimenté, et les requêtes d'information qu'on est obligé de formuler sont à caractère ponctuel et les résultats difficilement exportables vers un autre type d'utilisation. Le serveur, Gallica de la Nouvelle Bibliothèque de France (http://gallica.bnf.fr/), par contre, présente un certain nombre d'œuvres littéraires numérisées soit en mode image, soit en mode texte. Ces textes sont téléchargeables. Ce qui amène le deuxième conseil : se rendre au site http://www.adobe.com/prodindex/acrobat/readstep.html et télécharger Acrobat Reader. Bon nombre des textes sur le serveur Gallica sont numérisés en format "PDF" ("portable document format") et sont lisibles uniquement à l'aide d'Acrobat Reader(3). Si l'on dispose également de Acrobat Distiller (il faut l'acheter, mais les universitaires peuvent bénéficier de prix avantageux) on peut rendre ces documents consultables en mode recherche.

Nous glissons ainsi vers la deuxième partie de cette chronique qui porte sur Balzac sur Internet. On trouve en effet sur le serveur Gallica, en mode image, un certain nombre de romans de Balzac dans des éditions rares dont Le Curé de village dans l'édition Souverain de 1841, La femme supérieure ; La maison Nucingen ; La torpille, dans l'édition Werdet, 1838, Séraphita chez Werdet (1835), Histoire de la grandeur et de la décadence de César Birotteau (Boulé, 1838), Une ténébreuse affaire (Souverain, 1842), Scènes de la vie privée, t. I et t. II (Mme Charles-Béchet, 1835). Il s'agit là d'une heureuse initiative dont les chercheurs doivent se réjouir tout en espérant que le nombre d'ouvrages présentés sous cette forme s'accroîtra de manière considérable. En effet, la possibilité de consulter chez soi, sur son propre écran, à ses propres loisirs et même d'imprimer un facsimile d'un livre rare constitue un progrès tout à fait remarquable dans les conditions de recherche. On peut regretter une seule chose à propos de Gallica : la complexité de l'arborescence. Il faut multiplier les opérations afin d'arriver au but que l'on s'est fixé. Mais ce n'est là qu'une vétille qui sera sans doute corrigée au fur et à mesure que la technologie s'implante davantage dans les mœurs.

Le serveur Gallica est en sans conteste la ressource la plus importante pour le chercheur qui s'intéresse aux œuvres de Balzac à proprement parler. En plus des livres en mode image, ce serveur donne, en mode texte, toute La Comédie humaine dans l'édition Furne grâce à une licence avec la maison Acamédia, responsable du Balzac CD-ROM (http://www.acamedia.fr/). Là encore les textes sont téléchargeables grâce à la méthode couper/coller. Il suffit d'appeler sur écran le roman que l'on souhaite travailler, d'appuyer sur les touches CTRL A et ensuite CTRL S pour stocker tout le texte en mémoire et ensuite le verser dans son propre document à l'aide de CTRL V. Au bout d'une heure ou deux on peut ainsi capter sur son propre disque dur la Comédie humaine dans son intégralité — précieuse banque de données dans laquelle on pourrait faire des recherches hautement poussées à l'aide d'HYPERBASE, par exemple. C'est en effet ce qu'Étienne Brunet propose sur son site http://134.59.31.3/%7Ebrunet/BALZAC/BALZAC.htm. Le corpus utilisé par Brunet n'est pas tout à fait le même — il est constitué de 49 romans saisis à partir de l'édition de la Pléiade, fondée comme on le sait sur le Furne corrigé — et on n'y peut se livrer à toutes les enquêtes possibles grâce à la version indépendante de'HYPERBASE. Toujours est-il que ce site extrêmement utile donne un excellent aperçu des résultats que l'on peut obtenir grâce à ce logiciel hautement performant. Celui qui s'intéresse peu aux fréquences lexicales chez Balzac rendra quand même visite à ce site ne serait-ce que pour voir la belle iconographie balzacienne — la meilleure à ce jour sur le Net...

Pour toute recherche sur le XIXe siècle il convient de commencer par le site que lui consacre Tim Unwin à Liverpool. L'un des premiers à lancer un site 19e, Unwin donne des informations précieuses pour qui veut œuvrer dans ce domaine y compris pour Balzac : http://www.bristol.ac.uk/dix-neuf/. En partant de Liverpool on se rendra vers la multitude d'autres sites où il est question de Balzac, tel ce petit site de Pierre Cohen-Bacrie, http://www.microtec.net/~pcbcr/balzac.html qui n'est pas dépourvu d'intérêt, non plus celui de François Bon qui présente un calendrier des manifestations organisées pour le bicentennaire, (lien remplacé par un nouveau site du même auteur : http://www.remue.net/litt/balzac.html) Enfin il ne faudrait pas négliger les deux petits textes balzaciens, relativement peu connus, que l'on découvre à la bibliothèque de Lisieux (http://www.bmlisieux.com/sommaire.htm), Traité des excitants modernes (1838) et Les caprices de la Gina (1842).

Il faut dire cependant que dans l'ensemble — et pour ma part je suis à la fois navré et surpris — la qualité des sites consacrés en partie ou dans leur totalité à Balzac, exception faite pour celui de Brunet et du serveur Gallica, est médiocre. Ce sont souvent des sites montés par des étudiants ou par des enseignants cherchant à présenter plusieurs auteurs. On en trouve d'ailleurs un inventaire quasiment complet à l'adresse suivante : http://globegate.utm.edu/french/globegate_mirror/19.html. Il est étonnant d'ailleurs, car c'est le point fort d'Internet, que l'iconographie balzacienne que l'on y trouve soit si pauvre. Une nouvelle fois il faudrait excepter la belle présentation de sculptures de Rodin que l'on découvrira à l'adresse suivante, http://www.bc.edu/bc_org/avp/cas/fnart/rodin/rodin.html : toujours est-il qu'il reste énormément à faire. Sans doute le CD-ROM Balzac comblera-t-il les désirs des Balzaciens lorsqu'il paraîtra, enfin, pour marquer le bicentennaire ; pourtant l'Internet les laissera sur leur faim jusqu'à ce qu'un chercheur sérieux ou une institution, comme la maison de Balzac, décide de créer un site digne du génie de l'auteur de La Comédie humaine.

Andrew Oliver

Université de Toronto

1. « Le XIXe siècle et l'Internet », Dix-neuvième siècle, nº 26, novembre 1997, pp. 2-10.

2. Je renvoie le lecteur à un article sur ces questions que j'ai publié en 1993 : « Du bon usage des textes éélectroniques : lesquels ? », TEXTE, nos. 13-4, 1993, pp. 291-306.

3. La nouvelle version, 4.0, présente des avantages notables par rapport aux versions précédentes y comprise l'option de téléchargement de l'image sur écran.