Thèses

Exploration textuelle du discours d’un quotidien régional de presse au carrefour des XIXe et XXe siècles : Le Petit Comtois (1883-1903).

Thèse de V. Lethier, sous la direction de J.-M. Viprey et P. Schepens

Jury

Sonia BRANCA-ROSOFF, Professeur à l’Université Paris III, Sorbonne nouvelle.
Jacques GUILHAUMOU, Directeur de recherche au CNRS, UMR « Triangles », ENS-LSH, Lyon. Pierre FIALA, Maître de conférences à l'Université Paris 12.
Michael PALMER, Professeur à l’Université Paris 3.
Alain RABATEL, Professeur à l'Université Claude-Bernard, Lyon 1.
Philippe SCHEPENS, Professeur à l’Université de Franche-Comté.
Jean-Marie VIPREY, Professeur à l’Université de Franche-Comté.

Thèse disponible dans son intégralité sur demande. Contact : virginie.lethier@univ-fcomte.fr

Résumé

À la différence des tendances actuelles de l’analyse du discours médiatique, majoritairement tournée vers la presse nationale contemporaine, notre thèse vise un titre régional du XIXe siècle : Le Petit Comtois (1883-1944). Plongeant ses racines dans différents terreaux de recherche, à savoir la linguistique de corpus, l’analyse du discours du côté de l’histoire (Guilhaumou, Robin), la statistique textuelle (Lebart, Salem) et l’analyse textuelle du discours (Adam, Heidmann), cette thèse interroge les apports d’une nouvelle philologie numérique (Rastier; Viprey, Mayaffre) se fixant pour programme de renforcer l’accès aux matérialités discursives.
Cette thèse articule ainsi deux axes de recherche complémentaires : d’une part, les conditions de la constitution d’une base de données textuelles finement établies, contrôlées et normalisées selon les recommandations XML-TEI, visant à favoriser le renouveau des lectures interdisciplinaires de la presse régionale de la Troisième République (chapitre II).
Il s’agit, ce faisant, de proposer des pistes méthodologiques en vue de la levée des obstacles techniques pesant sur l’acquisition et le partage de grands volumes de données textuelles, dont dépendent les avancées des sciences du texte. Partant, on replacera ces pistes dans la perspective des débats théoriques contemporains en linguistique textuelle et linguistique de corpus.
D’autre part, notre objectif est d’apporter un éclairage sur le discours du Petit Comtois sur la période 1883-1903 à partir d’un corpus de 5,5 millions de mots en articulant diverses méthodologies et niveaux d’analyse, de sorte à appréhender dans toute son hétérogénéité et sa complexité l’objet texte. Si notre recherche s’appuie principalement sur les outils de la statistique textuelle qui permettent de faire monter du corpus lui-même ses reliefs linguistiques, textuels, discursifs, envisagés comme des vecteurs d’exploration, elle vise à dépasser la traditionnelle entrée du vocabulaire sur laquelle se fonde la lexicométrie, et ses modes d’approche traditionnels sur cette entrée même.
Parce qu’un texte est tout d’abord inscrit sur un support matériel signifiant, notre premier temps d’analyse textuelle du discours du Petit Comtois (chapitre III) est ainsi consacré à l’analyse de la mise en forme de l’information, telle qu’elle se donne à lire à travers l’organisation matérielle de l’aire scripturale (Peytard) et les niveaux d’organisation que sont le rubriquage et le système de titres du quotidien.
Plus qu’un simple « chemin de fer » ayant pour fonction de catégoriser l’information, le rubriquage constitue un des ressorts principaux de la rédaction pour hiérarchiser l’information. Parce qu’il rend compte des catégories par lesquelles le quotidien découpe le monde, ce niveau constitue un lieu d’accès privilégié à l’identité du quotidien. Une analyse quantitative du rubriquage, mesurant la surface, l’emplacement topographique de chaque rubrique, sa fréquence moyenne, nous a permis d’observer, outre les thématiques principales du quotidien, les stratégies par lesquelles celui-ci hiérarchisait l’information. Ce volet d’analyse nous a permis d’observer que Le Petit Comtois, à l’instar de la presse quotidienne régionale de la Troisième République, fait la part belle aux événements de portée nationale et internationale, ainsi qu’à la vie politique de la Troisième République. Un examen linguistique des intitulés de rubrique du journal a pour sa part démontré la forte mise en valeur de la coïncidence de la temporalité de l’imprimé quotidien avec celle du monde, ainsi qu’une forte persistance des liens avec la matrice littéraire (Thérenty), perceptible notamment à travers la prédominance des intitulés de rubrique référant à l’écriture épistolaire.
Notre intérêt s’est ensuite porté sur les titres du Petit Comtois, dont nous avons interrogé les caractéristiques linguistiques et fonctionnelles, les variations et les régularités en diachronie. Celles-ci ont été analysées à partir de l’étude d’un sous-corpus substantiel de 6910 titres, extrait d’une des rares rubriques comportant des titres de façon permanente de 1883 à 1903 : les « dépêches de nuit ». En premier lieu, au terme de l’analyse, a été dégagée la fonction de classification de l’information dans un horizon thématique, géographique ou historique assurée par les titres, au détriment d’une fonction d’annonce et de condensation de l’information principale de la dépêche. En second lieu, dans cette rubrique emblématique du journalisme d’information inscrite dans un quotidien revendiquant sa fonction d’organe porte-parole d’une sensibilité politique, les titres sont le lieu d’une coloration de l’information livrée par la voix du correspondant ou de l’agence Havas et donc des indices précieux de l’ethos discursif (Amossy) du quotidien : tout en exprimant sa lecture de l’actualité, Le Petit Comtois recourt à une parole railleuse et ludique, un certain franc-parler, visant à entretenir la connivence et la proximité avec son lecteur.
Dans un second mouvement (chapitre IV), nous avons entrepris une série d’explorations dans le vocabulaire du Petit Comtois, entendues comme le socle d’un parcours objectivé du discours du journal. Une série de prise de vue sur le vocabulaire du Petit Comtois ont ainsi été constituées.
L’index hiérarchique du corpus, analyse fort classique en lexicométrie, a livré une première indication sur la consistance lexico-thématique du corpus, en confirmant notamment l’ouverture du quotidien sur un horizon politique dont Paris est le cœur géographique et l’importance de la temporalité dans Le Petit Comtois.
Une seconde analyse, tout aussi classique en lexicométrie, a consisté à examiner la ventilation du vocabulaire en diachronie (ou niveau macro-distributionnel) grâce aux méthodologies de l’AFC : celle-ci a pointé pour sa part une très nette division du corpus en deux séquences chronologiques distinctes : 1884-1896 d’une part, et 1897-1903 d’autre part. L’analyse des profils macro-distributionnels des items, associée à un mouvement de retour au texte, nous ont permis d’interpréter ce clivage comme l’opposition entre une première séquence marquée par un contexte colonialiste et revanchard ainsi que par les fameuses « affaires » politico-financières, et une séquence chronologique témoignant pour sa part d’un tournant radical et de l’intensification des débats autour de la question sociale.
Nous nous sommes ensuite tournée vers l’analyse de la configuration fine du vocabulaire (niveau micro-distributionnel - Harris), mode d’accès privilégié à la textualité-texture, à ses dimensions non linéaires (tabulaires, réticulaires), encore insuffisamment exploitées et conceptualisées. L’analyse micro-distributionnelle du vocabulaire du Petit Comtois a ainsi suggéré que la configuration fine du vocabulaire s’organisait autour de quatre pôles isotropiques (Viprey), à consistance lexico-thématique voire rhétorico-stylistique, évoquant respectivement (1) les faits divers et leur passage en justice, (2) la vie législative, (3) les réseaux locaux de sociabilités, et enfin, (4) le vocabulaire du politique, voire de l’idée républicaine.
Nous avons voulu observer l’évolution diachronique de cette configuration fine en diachronie. De façon très stimulante, si l’on tient compte des résultats livrés par l’examen du niveau macro-distributionnel et de la nature du discours étudié, la structure fine du vocabulaire se révèle extrêmement stable en diachronie. De rares items témoignent d’une évolution significative de leur co(n)texte d’une diachronie à une autre. Il est intéressant de remarquer que ceux-ci sont particulièrement emblématiques des évolutions socio-politiques dont prend acte la fin d’un très long XIXe siècle. C’est notamment le cas de la forme ouvriers, dont l’évolution très nette du profil collocatif marque celle de son sens. Dans un dernier temps, nous avons examiné les facteurs responsables de la stabilité du rubriquage observée : l’analyse des spécificités des rubriques a ainsi révélé une forte corrélation entre le niveau du rubriquage et celle de la structure fine du vocabulaire. L’invariance des « motifs » lexicaux et stylistiques du quotidien nous suggère donc que l’actualité et son essence présupposée « fluctuante », restent contrôlées et organisées par les pratiques routinières journalistiques, renvoyant tant à la sélection de l’information qu’à sa mise en scène comme événement. 
Enfin, un dernier temps de cette recherche (chapitre V) est dédié à la consolidation d’une méthode de typologie en corpus, appliquée au classement des rubriques, basée sur le niveau morphosyntaxique. À la recherche d’une typologie discursive des rubriques du Petit Comtois, ce volet d’analyse examine les vertus et les insuffisances d’un étiquetage automatique et explore les perspectives offertes par l’AFC en vue d’un dialogue continué avec les données. Devant être envisagé comme le préalable à une analyse linguistique des genres journalistiques qui croiserait le niveau du vocabulaire et le niveau de la morphosyntaxe tout en tenant compte du plan compositionnel du texte (Bakhtine) grâce à un encodage xml-tei, cet empan de nos recherches constitue une investigation méthodologique visant à se doter d’un protocole robuste et transparent d’analyse.
À la suite des travaux pionniers de Douglas Biber, de nombreuses études de typologie textuelle convoquent aujourd’hui le niveau morphosyntaxique. La logométrie, telle que définie par D. Mayaffre, perçoit d’ailleurs dans les progrès de l’étiquetage automatique un renouvellement décisif de l’analyse des données textuelles. Cette position implique de s’accommoder du taux d’erreur intrinsèque aux données issues d’un étiquetage automatique, dont l’influence est supposée modérée  par la méthodologie statistique utilisée. Une analyse du discours soucieuse de la matérialité du texte ne peut néanmoins se satisfaire de ce taux d’erreur : entendant l’annotation morphosyntaxique comme un véritable état du texte, elle implique au contraire un étiquetage fin du niveau morphosyntaxique. Or, l’expérience menée dans le cadre d’une entreprise typologique des rubriques du Petit Comtois montre que l’étiquetage automatique réalisé par Cordial est loin d’être suffisant pour répondre à cette prétention : l’étiquetage opéré reste un étiquetage « en langue », aux insuffisances duquel s’ajoutent les limites du lexique interne de Cordial. On regrettera par ailleurs la pertinence discutable des catégories statiques de la grammaire traditionnelle convoquée par ce logiciel.
En raison de ces insuffisances  et en attendant de mener une contre-expérimentation basée sur un étiquetage fin et contrôlé de nos données, il nous semble ainsi devoir prendre quelques précautions avec les résultats obtenus de notre analyse, fort stimulants au demeurant.  En effet, notre analyse des variables morphosyntaxiques dans les rubriques du Petit Comtois met au jour des facteurs très discriminants, parmi lesquels, d’une part, des variables assez inattendues (à l’instar des déterminants définis) et d’autre part, des facteurs faisant écho aux critères génériques journalistiques. On peut interpréter la configuration typologique des rubriques obtenue comme étant notamment fortement structurée par  l’opposition entre les productions discursives à énonciation impliquée et les productions caractérisées par un effacement énonciatif, configuration affinée par le degré de complexité des phrases et leur longueur. Le genre semble donc un « facteur » structurant de cette typologie, ce qui nous semble devoir être mis en lien avec la taille colossale du corpus étudié et la méthodologie statistique utilisé, puisque l’AFC donne une représentation synthétique des tendances lourdes voire structurelles d’un ensemble de données. En l’occurrence, le genre est cette tendance, qui, dans la lignée des postulats de l’analyse du discours, s’avère déterminant dans la typologisation des productions discursives journalistique du Petit Comtois.