Site de l'université de Franche-Comté
Labo Adcost-elliadd

ADCoST (Analyse de discours, corpus et sciences des textes)

Programme

Dans l’ordre du discours :

Avec d’autres, mais avec une orientation spécifique et originale, l’équipe a saisi l’occasion, offerte par la révolution numérique, de donner un sens opératoire au programme (années 70) d’« Analyse automatique du discours » (Pécheux), et d’en affiner la formule (en travaillant le sens d’automatique). Nous partageons le diagnostic (Sarfati, repris par Adam-Heidmann 2005), encore actuel, d’un « déficit » textuel et linguistique de l’analyse du discours, et la volonté d’y remédier par une maîtrise conceptuelle des corpus (Mayaffre) et des textes (Adam, Rastier). Nos analyses discursives sont désormais régulièrement soumises à la contrainte de grands ou très grands corpus.
Nous n’en perdons pas pour autant de vue la philosophie qui préside à l’analyse du discours, dans la lignée de Foucault et du projet de philosophie critique, notamment rattaché à l’École de Francfort. Nous examinons l’actualité des concepts d’espace public (Habermas, Honneth), nous attachant à y repérer les formes et supports de la circulation discursive, en référence aux travaux de Volochinov.

Dans l’ordre du texte :

Comme les grandes inventions antérieures, la numérisation bouleverse à la fois la production, la diffusion et le statut des textes. Surtout, elle modifie radicalement les conditions de leur établissement, de leur configuration, et de leur analyse (philologie numérique). Toutes les catégories conceptuelles doivent être remises en perspective : « qu’est-ce qu’un texte à l’ère numérique ? », texte et énoncé, texte et document, texte et discours, texte et oeuvre. Ayant écarté toute conception naturaliste des « données textuelles », nous interrogeons l’unité et la stabilité de l’objet « texte » pris sous tous ses aspects. Nous élaborons les concepts liés aux structures non linéaires et non séquentielles (isotropie).

Dans l’ordre des genres :

Le genre apparaît comme un concept nécessaire à l’analyse linguistique et sémiotique des textes, car il est le lieu où s’articulent les contextes d’énonciation et les normes langagières, le lieu où s’explicitent les jeux de différentes sémiotiques qui informent le texte et contraignent l’interprétation. L’approche et la typologie textuelles peuvent apporter de nouvelles données à la morphosyntaxe, à la pragmatique et aux théories de l’énonciation, que ce soit en synchronie ou en diachronie, et que le développement d’une linguistique de corpus autorisera une observation raisonnée, quasi expérimentale des productions langagières.
L’un des objectifs à court terme des travaux regroupés sous ce chef est de créer une sorte d’observatoire du discours académique en collaboration avec Sylvain Loiseau (Maison de la Recherche en Sciences Humaines, Université de Caen Basse Normandie) et Céline Poudat (UMR LDI Paris-13).

Dans l’ordre des corpus :

Le temps est révolu où les corpus d’analyse du discours étaient du « texte » nu au kilomètre. Désormais, un corpus est une collection de documents représentant et attestant les textes dans leur multi-dimensionnalité, grâce à l’annotation interne (linguistique, documentaire, intertextuelle) et grâce à la variété non limitée des métadonnées embarquées. Le défi qui s’impose aux équipes de recherche est de maîtriser cette structuration.
Notre groupe de recherche s’est lié depuis de nombreuses années aux promoteurs de la TEI (Lou Burnard est membre, au titre de notre pôle, du Conseil Scientifique de la MSHE). Il développe deux environnements de marquage linguistique des textes (l’un automatique et multilingue, NooJ, l’autre interactif et dédié au français, DiaTag). L’équipe est maître d’oeuvre du scriptorium numérique FANUM, dont une mission essentielle est de concevoir et assurer la pérennité des bases textuelles enrichies.

Dans l’ordre de la/des langue-s

C’est dans ce domaine que l’informatique a été le plus tôt comprise comme une révolution autant conceptuelle que méthodologique. Le programme inclut des recherches de pointe dans la lignée des travaux pionniers de Maurice Gross, déployées dans le logiciel et dans le réseau NooJ, en linguistique informatique et fouille documentaire à consistance linguistique, dans un ensemble de langues diverses et en nombre croissant. NooJ est un environnement de développement linguistique qui permet de construire et de gérer des dictionnaires et grammaires électroniques à large couverture, afin de formaliser divers niveaux des langues naturelles : orthographe, morphologie flexionnelle et dérivationnelle, lexique de mots simples, mots composés et expressions figées, syntaxe locale et désambiguisation, syntaxe structurelle et transformationnelle, sémantique et ontologies. Les descriptions formalisées peuvent ensuite être appliquées pour traiter des textes et corpus de taille importante. NooJ est utilisé dans des applications variées du Traitement Automatique des Langues Naturelles (par ex. moteurs de recherche, extracteurs d’entités nommées, terminologie, traduction automatique), ainsi que comme outil de linguistique de corpus, et en enseignement. Les utilisateurs de NooJ forment une communauté en expansion qui, à l'heure actuelle, développe des ressources linguistiques à large couverture dans une quinzaine de langues.


Le domaine couvert par ADCoST comporte également des recherches en lexicologie et phraséologie, en stylistique, diachronique et synchronique, reliées à l’AD, et fondées sur la statistique textuelle.

Dans l’ordre de la communication politique

Les travaux sur les discours médiatiques (dont la presse notamment) prenant de plus en plus d’importance dans notre programme de recherche et ceux sur le discours politique, l’étude de ces objets discursifs nous ramène constamment à la communication politique.
Le travail des médias est déterminant dans la mise en intrigue de la vie politique quotidienne. Celle-ci est fortement marquée par les liturgies politiques (Rivière 1988) et les styles de communication.
Nous considérons qu’aujourd’hui les nouvelles technologies de l’information cristallisent une idéologie de la communication autour de la problématique du lien social et de la dimension politique. La dimension symbolique de la relation entre gouvernants et gouvernés s’exprime à travers des rituels sociaux considérés dans l’Ancienne rhétorique (Aristote, Quintilien, Cicéron) et dans la Nouvelle rhétorique (Perelman) comme des formes de persuasion de l’épidictique.
C’est un espace d’affrontement et d’expression des légitimités au travers duquel peuvent se lire l’idéologie et l’action des hommes politiques, l’information pour les journalistes, la communication pour l’opinion publique.
D’où la nécessité de concilier analyse du discours politique, analyse du discours des médias et communication politique pour mieux explorer l’espace public.
Dans ce domaine aussi, l’attention aux matérialités discursives est soutenue. En témoignent les travaux de Barry visant à repérer, codifier et baliser dans les corpus (Sékou Touré, pères des indépendances africaines) la prosodie et les autres aspects d’oralité et de scénographie.
Un développement récent et futur concerne les recueils d’aveux et témoignages produits sous la contrainte en Guinée et plus généralement en Afrique post-coloniale.

Des domaines et corpus diversifiés et représentatifs

Le programme ne se limite pas à développer des concepts, des méthodes et des outils. Il explore également nombre de domaines discursifs, notamment :
?Corpus relevant du discours littéraire (France, de 1750 à nos jours – Baudelaire, Balzac et le réalisme français, Claudel, Le Clézio, Aragon, Céline) – M.Kastberg et J.-M. Viprey.
?Ph. Schepens et V. Lethier sont responsables d’un important chantier de constitution d’une base de presse historique (Presse Quotidienne Régionale Troisième République – PQR3R) et, avec J.-M. Viprey, de recherches sur contrat dans le domaine du discours public.
?D. Ablali conduit des travaux sur le discours scientifique et académique en développant une sémiotique des textes assise sur l’épistémologie de la sémiotique et ouverte sur les recherches textuelles informatisées.
?A.O. Barry est à la tête d’un réseau très productif dédié aux discours de l’Afrique postcoloniale francophone, où sont abordées des sphères variées, allant de la parole dirigeante (périodes des indépendances et contemporaine) au domaine littéraire et patrimonial (jusqu’aux littératures orales), en passant par les catégories des discours sous contrainte (aveux, témoignages…).
?M. Silberztein est le créateur et l’animateur du projet NooJ, qui rassemble chaque année plusieurs workshops internationaux, avec de nombreuses équipes internationales participantes.
?Ph. Schepens conduit l’acquisition numérique et la transcription d’archives déposées au Musée de la Résistance et de la Déportation de la ville de Besançon : il s’agit de journaux intimes écrits durant l’occupation, qui constituent une source d’études très féconde aussi bien des idéologies qui s’affrontaient alors que des formes différenciées que suppose cette écriture sous l’occupation. Un élargissement national de cette action est envisagé.

Spécificité/originalité et transversalité du projet

A travers notre activité à la MSHE dans le cadre du pôle Archive Bases Corpus, nous déployons un atelier transversal où jouent spécifiquement les savoir-faire acquis et les questionnements en cours : le Scriptorium Numérique FANUM . Celui-ci est plus précisément destiné :
– à mutualiser les compétences scientifiques et les moyens technologiques des laboratoires franc-comtois recourant à des données textuelles et/ou audio-visuelles numérisées ;
– à associer à l'Université les institutions de conservation, de patrimoine et d'archives, notamment régionales, et des éditeurs scientifiques.

Le Scriptorium Numérique articule d'ores et déjà 10 projets associant recherche fondamentale, recherche appliquée et mise à disposition de ressources patrimoniales, tous ouverts sur des institutions extérieures et des coopérations nationales et internationales. Du point de vue de l’équipe ADCOST, FANUM est un champ d’expertise et de mise à l’épreuve des méthodes de constitution des données, et de leur exploration.
?Sur le plan théorique, tout en poursuivant notre implication forte dans l’actualisation des linguistiques textuelles, dans la linguistique de corpus, et dans la théorisation du numérique pour corpus et textes, nous nous proposons de contribuer à l’approfondissement de l’articulation, aux sciences du discours, des théorisations de l’école de Francfort et du renouveau des études sur Marx et le socialisme français.
?Sur un plan matériel, nous entendons passer à un stade nouveau de l’acquisition et de la consolidation de bases textuelles pouvant servir à la fois de réservoir et de référence pour les corpus de recherche en discours, dans le cadre de coopérations multiples (laboratoires proches, grands équipements – ADONIS, partenaires – bibliothèques).


Actualités

Ecole MISAT

 - Ecole Thématique du CNRS-Institut SHS  sur les "Méthodes Informatiques et Statistiques en Analyse des Textes"
 - Entre le 19 et le 24 juin 2016
 - Appel à candidature jusqu'au 10 Avril 2016
 - En savoir plus ...



LES ACTEURS DU DISCOURS : DE L’ÉNONCIATEUR À L’ACTEUR SOCIAL

 - Colloque international les 11 et 12 juillet 2016
 - Appel à communication jusqu'au 29 janvier 2016
 - En savoir plus ...