Lexèmes expressifs affixaux dans la langue de la presse francophone contemporaine
(France, Canada, Belgique)


Université Sorbonne Paris IV
Année universitaire 2004-2005

   

Bibliographie

Annexes : listes de mots par préfixes et par suffixes

Liens utiles

Me contacter

Google
 
Web dea.isachenko.free.fr
 

Introduction

La presse francophone contemporaine est une source inépuisable non seulement d’information mais aussi de matériel linguistique varié. On ne peut pas nier l’influence que les mass médias, et plus particulièrement la presse, exercent sur le développement des langues. Il est certain que ce genre textuel représente un énorme intérêt pour les linguistes. La presse écrite est un genre particulier, dont la particularité principale est le reflet momentané de la réalité. Le style des journaux est un style à part, dont les fonctions communicatives sont d’informer et de donner une opinion. Les auteurs écrivent les articles rapidement, essayant le plus vite possible d’informer le lecteur, donc, ils n’ont pas de possibilité de travailler soigneusement leur langue comme le font les écrivains. Cette particularité se voit surtout dans les éditions quotidiennes que les chercheurs appellent «presse d’information » contrairement à la «presse d’opinion» (les éditions hebdomadaires).

La langue de la presse n’est pas constante, elle reflète parfois le langage parlé tout en l’influençant, ce qui la rend intéressante pour les linguistes. Le lexique de la presse écrite est très varié du point de vue stylistique et des registres.

Les mass médias jouent un rôle très important dans le monde contemporain et, comme indiqué ci-dessus, il est facile d’expliquer l’intérêt que des linguistes portent à la langue de la presse. On peut étudier la langue de la presse de points de vue différents. Dans les années 70-80 de nombreux chercheurs s’appuyaient dans leurs recherches sur la catégorie du genre. Mais la question de la division des genres de la presse écrite n’a pas été totalement résolue et l’une des questions les plus polémiques est celle de la différence entre le genre et la rubrique dans la presse. “La presse écrite comporte des catégories rédactionnelles que les manuels de journalisme détaillent avec plus ou moins de convergence et que les journaux et magazines signalent parfois explicitement: éditorial, reportage, commentaire, analyse, courrier des lecteurs, revue de presse, etc. Il existe, d’autre part, des rubriques qui sont même à la base du découpage des journaux: questions politiques, économie, questions internationales, pages régionales, culture, […] entreprises, finances, sports, services, etc. Ce double classement des unités rédactionnelles de la presse écrite, en genres et rubriques explique assez bien le fait que, quand on veut en savoir plus à propos de ces catégories, on se trouve en face d’une hétérogénéité et d’un flou définitionnel décourageants” .

La quasi-totalité des chercheurs note que, dans la presse contemporaine, il faut faire face au mélange permanent des genres, ce qui rend difficile leur classification. “Chacun des genres journalistiques est adapté pour rendre un son particulier. Le reportage, c’est la vie. Le portrait, c’est l’épaisseur humaine. L’interview, c’est la riche sonorité d’une voix. L’enquête, c’est la clarté de la démonstration. Ces caractéristiques, qu’une bonne plume doit savoir rendre, aident à donner du relief à un journal. Surtout, ces caractéristiques étant très différentes les unes des autres, l’opposition sur une même page entre la sérieuse enquête et l’interview plus légère va donner au lecteur le sentiment de la variété de ce qui lui est offert” .

L’absence d’opinion unique sur la question de la classification des genres nous permet d’étudier la langue de la presse en général, en tenant compte non pas des genres concrets, mais de l’ensemble du corpus journalistique.

Jusque très récemment, le dépouillement manuel était la seule méthode de travail envisageable, mais elle ne pouvait mener qu’à des résultats incomplets et hasardeux, permettant uniquement de prouver l’existence dans la langue de tel ou tel lexème. Par contre, quand il s’agit de l’analyse quantitative, de création de graphiques et de tableaux statistiques, il est nécessaire de recourir à des données plus nombreuses et moins hasardeuses. Pour ces raisons on fait appel à la linguistique de corpus, car «nous disposons aujourd’hui, et depuis quelques années déjà, de puissants outils informatiques et d’innombrables corpus de textes informatisés » . Qu’est-ce qu’un corpus textuel ? Selon L’Encyclopaedia Universalis, un corpus textuel peut être tout simplement défini comme « Un rassemblement de textes ou une collection de textes sur la base d’hypothèses de travail en vue de les interroger ». Le développement des performances des ordinateurs et des logiciels d’une part, la disponibilité effective de bases de données textuelles toujours plus vastes d’autre part, permettent aux chercheurs désormais d’envisager de traiter des corpus de plusieurs dizaines de millions de mots . Les banques de données textuelles nous permettent de traiter d’une manière plus scientifique les problèmes en question. Les célèbres banques de données textuelles, telles que Frantext, Québétext, Suistext nous donnent un immense nombre d’exemples de la littérature française, suisse et canadienne, du XVe siècle à nos jours, ce qui nous permet de calculer la fréquence de tel ou tel mot. Outre ces bases de données littéraires, il existe également d’autres corpus de données, moins explorés pour le moment mais qui présentent un grand potentiel : les corpus des journaux, qu’ils soient quotidiens, hebdomadaires ou mensuels. Ces corpus peuvent nous fournir un matériel abondant et très vivant.

Certains des journaux qui nous intéressent sont accessibles sur CD ROM («Le Soir» de Bruxelles, «Libération» de Paris, par exemple), mais ces CD ROM sont coûteux et difficiles à trouver, et ne garantissent pas un accès libre à leur contenu (la possibilité d’établir des statistiques, par exemple, car ils ont été conçus avant tout pour la consultation d’articles et non pour des recherches linguistiques). Pour cette raison il est plus facile d’accéder aux corpus de données textuelles à travers les sites Internet des journaux en question : le contenu des journaux y est présenté de manière quasi-intégrale, avec des outils de recherche satisfaisants, bien que perfectibles, et il est facile d’en extraire de manière automatique le contenu textuel afin d’effectuer les analyses désirées.

Les ressources de la Toile sont inépuisables et incomparables, mais il ne faut pas nier que c’est un corpus de données difficilement contrôlable, constamment en évolution et totalement hétérogène. Bien que le recours à la Toile comme corpus linguistique commence à se répandre, il possède de nombreuses particularités à prendre en compte. En outre, ce genre de recherche pose de nombreuses questions, et en particulier, le fait que ce type d’exploration nécessite le développement d’outils d’extraction et de tri spécifiques ; beaucoup reste à faire dans ce domaine pour sortir du travail artisanal. Comme le dit Greffenstette, « la Toile a tout pour faire fuir des linguistes travaillant sur corpus : une absence complète de contrôle sur le contenu, une hétérogénéité flagrante, et une absence totale de validation. Toutefois, la masse et sa constante évolution en font un lieu privilégié de la recherche concernant la dynamique lexicale » .

Tout au long de ce travail on tentera de trouver les moyens les plus convenables pour interroger chacun des sites des journaux en question, ce qui est décrit de manière plus détaillée dans le chapitre « Méthodes de recherches ».

Le but de cette recherche est de comparer les utilisations des affixés expressifs dans la presse francophone. Il est à noter que dans ce travail, nous avons limité la francophonie à trois pays : la France, le Canada et la Belgique. Nous avons rencontré quelques difficultés pour consulter le corpus des journaux suisses (voir le chapitre «Méthodes de recherches »), dons nous n’avons pas pu les étudier lors de ce travail. Dans ces recherches nous utilisons le matériel lexical de trois journaux : « Libération » de France, « Le Soir » belge et « Le Devoir » canadien.

Ces journaux ont été choisis pour les raisons suivantes : ce sont des éditions de masse, lus par des centaines de milliers de lecteurs par jour; ce sont des journaux avec un long historique (stables) qui existent depuis plusieurs années; ce sont des journaux ayant des exigences strictes en ce qui concerne les normes de la langue.

Pour effectuer ces recherches, nous avons accès à trois corpus de données de tailles différentes : le journal « Libération » français – 230.000 articles, « Le Soir » belge – 80.000 articles, et «Le Devoir » canadien – 235.000 articles. Il est à noter que, tout le long de ce travail, nous tenons compte de la différence de leurs tailles resperctives, ce qui signifie que pour les conclusions sous forme de graphiques nous prenons les données relatives.

Il existe plusieurs façons de classer les unités affixales. Le classement qui se trouve au centre de ce travail est celui fait du point de vue axiologique (valoration subjective) et grammatical (nom ou adjectif) ; les autres classements pertinents pourront être étudiés ultérieurement, dans le prolongement de ce travail.