Voir le résumé
À la différence des tendances actuelles de l analyse du discours médiatique, majoritairement tournée vers une presse du XXIe siècle nationale, cette thèse vise un titre régional du XIXe siècle : Le Petit Comtois (1883-1944). Plongeant ses racines dans différents terreaux de recherche, à savoir la linguistique de corpus, l analyse du discours du côté de l histoire (Guilhaumou, Maldidier, Robin), la statistique textuelle (Lebart, Salem) et l analyse textuelle du discours (Adam &Heidmann), cette thèse interroge les apports d une nouvelle philologie numérique ( Rastier ; Viprey) se fixant pour programme de renforcer l accès aux matérialités discursives. Cette thèse articule ainsi deux axes de recherche complémentaires : d une part, les conditions de la constitution d une base de données textuelles finement établies, contrôlées et normalisées selon les recommandations XML-TEI, visant à favoriser le renouveau des lectures interdisciplinaires de la presse régionale de la Troisième République. Il s agit, ce faisant, de proposer des pistes méthodologiques en vue de la levée des obstacles techniques pesant sur l acquisition et le partage de grands volumes de données textuelles, dont dépendent la confrontation heuristique des points de vue, des outils et des méthodes des sciences des textes. D autre part, notre objectif est d apporter un éclairage sur le discours du Petit Comtois (1883-1903) à partir d un corpus de 5,5 millions de mots en faisant dialoguer diverses méthodologies et niveaux d analyse, de sorte à appréhender dans toute l hétérogénéité et la complexité du texte. Si notre recherche s appuie principalement sur les outils de la statistique textuelle qui permettent de faire monter du corpus lui-même ses reliefs linguistiques, textuels, discursifs, envisagés comme des vecteurs d exploration, elle vise à dépasser l entrée du vocabulaire sur laquelle se fonde la lexicométrie, et ses modes d approche traditionnels sur cette entrée même.