1: Les dictionnaires informatisés :
2: un atout pour l' histoire du lexique
3: Agnès Steuckardt
4: Université de Provence
5: Laboratoire Parole et Langage ( UMR 6057 )
6: Agnes.Steuckardt@univ-provence.fr
7: Les dictionnaires informatisés ouvrent un accès nouveau à la connaissance du lexique .
8: Si l' apport de ces outils documentaires à la sémantique a été plus spécialement souligné ( Martin , 2001 ) , on aimerait ici en indiquer une autre exploitation possible , orientée vers une description diachronique du lexique .
9: La première approche se focalise sur la rubrique « Définition » du dictionnaire ;
10: celle que l' on propose s' appuie sur la date de publication du dictionnaire et sur la rubrique « Étymologie » , quand elle existe .
11: Idéalement , les informations contenues dans cette rubrique devraient permettre de constituer des ensembles lexicaux en fonction de la date de première attestation , de la langue d' origine , de l' étymon , des morphèmes dérivationnels .
12: Dans la réalité actuelle , les dictionnaires informatisés n' offrent pas toujours la possibilité même d' une requête étymologique , parce qu' ils n' ont pas nécessairement jugé utile de fournir des informations de cette nature .
13: Quand ils l' offrent , ils sont loin d' ouvrir les différents accès que constitue chaque caractéristique étymologique .
14: Le Trésor de la langue française informatisé ( TLFi ) , le Nouveau petit Robert électronique ( PRE ) et le Nouveau Littré électronique ( NLE ) esquissent pourtant les premiers linéaments de ce type d' investigation .
15: Les résultats de chacun à une même requête étymologique révèlent des disparités .
16: Sans doute la qualité du balisage , et parfois de l' enquête étymologique , peut -elle être mise en cause , mais plus souvent ces disparités révèlent des décisions lexicographiques différentes , c' est-à-dire des questions linguistiques non résolues .
17: On indiquera dans un premier temps les limites actuelles des recherches par critère étymologique dans les dictionnaires informatisés .
18: À travers deux études de cas :
19: la recherche par langue d' origine et la recherche par date , on montrera cependant comment le TLFi , le PRE et le NLE peuvent d' ores et déjà constituer non seulement un instrument , mais aussi un aiguillon pour l' histoire du lexique .
20: Les recherches étymologiques dans les dictionnaires informatisés
21: Le succès d' une recherche étymologique dans un dictionnaire informatisé dépend à la fois des informations contenues dans le texte des articles et du balisage que les informaticiens-linguistes y ont opéré .
22: La première limite de cette recherche réside dans la présence même de l' information étymologique :
23: de ce point de vue , lexicographie ancienne et lexicographie moderne ne présentent pas les mêmes normes .
24: La seconde , qui ne concerne que les dictionnaires modernes , se trouve dans les choix de balisage et leur degré de précision .
25: L' absence de rubrique « Étymologie » dans les dictionnaires anciens
26: Le souci étymologique n' est apparu que progressivement chez les lexicographes .
27: Les « Dictionnaires d' autrefois » , pour reprendre la dénomination choisie par les concepteurs d' une précieuse base de données lexicographiques , ne comportent pas de rubrique « Étymologie » .
28: Leur forme informatisée , aussi minutieuse soit -elle ( Wionet , Tutin , 2001 ) ne peut donc pas directement permettre de navigation par ce type de critère .
29: Deux biais toutefois rendent possibles leur exploitation dans une perspective d' histoire du lexique :
30: l' exploitation des dates de publication des dictionnaires et les informations de nature étymologique dispersées dans le texte des articles .
31: À la faveur de leur réunion dans une même base de données , on peut comparer leur nomenclature :
32: on saisira ainsi le moment de la lexicographisation d' un mot ou d' un sens nouveaux .
33: Si la base Dictionnaires d' autrefois permet ce type d' enquête , son maillage , avec sept dictionnaires pour parcourir cinq siècles , reste cependant un peu lâche .
34: À cet égard , la base informatisée du Petit Larousse de 1905 à 2005 , en cours d' élaboration au Laboratoire « Lexiques , Dictionnaires et Informatique » ( Cergy-Pontoise ) , devrait procurer des résultats beaucoup plus fins , du moins pour le 20e siècle .
35: Valoriser , par le développement de telles bases de données , un patrimoine lexicographique qui constitue « une spécificité française au coeur de la galaxie Gutenberg » ( Pruvost , 2000 : 10 ) , c' est aussi donner un tremplin à la description diachronique du lexique français .
36: Même si les dictionnaires anciens ne consacrent pas systématiquement une rubrique spécifique à l' étymologie , certains , comme par exemple le Dictionnaire critique de la langue française de l' abbé Féraud ( 1787 - 1788 ) , jugent utile de signaler la langue d' origine d' un mot emprunté .
37: Les recherches en plein texte ouvrent dès lors une voie d' investigation .
38: On pourra par exemple reprendre sur de nouveaux frais l' enquête menée par John Humbley , il y a une vingtaine d' années , sur les anglicismes dans le Dictionnaire critique de Féraud ( Humbley , 1986 ) .
39: La recherche en plein texte du mot :
40: anglicisme dans la base de données du Dictionnaire critique permet de repérer 10 mots que l' enquête traditionnelle n' avait pas relevés ( coalition , compassioner , dépravité , disgrâcieux , empiètement , inconsistance , inofficieux , non-sens , prescriptions , spontanément ) ;
41: celle du mot :
42: anglais en fournit encore 11 de plus ( bambou , importation , importer , interlope , lord , paquebot , ponche , redingote , toste , toster , vote ) .
43: UneDes étude plus large sur le traitement des emprunts dans les dictionnaires d' autrefois pourra , grâce à leur informatisation , trouver un aboutissement rapide .
44: Le TLFi :
45: un balisage limité à la « Langue empruntée » Le TLFi offre une grande richesse dans le balisage général des articles :
46: les critères de recherche , regroupés en 30 « Types d' objet » ( par exemple : Synonymes , Domaine général , Construction , Indicateur ) sont déterminés par l' utilisateur , qui pourra ainsi , dans le type Domaine général spécifier l' objet « vestimentaire » , ou dans le type Indicateur spécifier « populaire » .
47: Toutefois , pour la rubrique « Étymologie » , un seul « Type d' objet » a été retenu :
48: la Langue empruntée .
49: Les autres informations , sur les dates et sources de première attestation , sur l' étymon , sur la formation du mot , n' ont pas été balisées et ne sont accessibles que par une recherche en plein texte , par le « Type d' objet » Paragraphe .
50: Sans doute la rubrique « Étymologie » ne donnait -elle pas encore pleine satisfaction aux concepteurs du TLFi :
51: une équipe de l' ATILF travaille actuellement à une révision des notices étymologiques , dont l' aboutissement est annoncé pour 2014 ( Steinfeld , Petrequin , Evrard , 2005 ) .
52: Les notices révisées sont publiées sur le web au fur et à mesure de leur rédaction :
53: actuellement 150 notices sont consultables à l' adresse :
54: www.atilf.fr interrogation commode par « classes étymologiques » est mise en place ;
55: trois classes ont été prévues :
56: « le lexique héréditaire » ,
57: « les transferts linguistiques » ,
58: « les formation française » , avec , pour chacune , une sous-catégorisation rigoureuse .
59: L' interrogation par date n' est cependant pas prévue , et l' information diachronique ne reste accessible que par la recherche en plein texte .
60: Le NLE :
61: requêtes par langue d' origine et par « Ancienneté » Le NLE a , du point de vue des requêtes étymologiques , suivi cet exemple de prudence .
62: Si , avec 11 critères de recherche , il permet des requêtes diversifiées ( notamment par Domaine , Usage , Code grammatical ) , la requête « Étymologie » n' informe que sur la langue d' origine .
63: Quelque 150 langues ont été distinguées , avec un luxe de finesse dans la catégorisation ;
64: pour le grec par exemple , le NLE ne définit pas moins de 14 sous-catégories .
65: Quelques catégorisations prometteuses ont été , bien qu' externes à la notion de « Langue d' origine » , insérées dans la liste :
66: les catégories « Nom propre » et « Étymologie populaire » .
67: Si elles ne fournissent pas pour l' instant de résultats considérables - trois résultats seulement pour la requête « Étymologie = Étymologie populaire » - , il suffirait de compléter les indications portées dans la rubrique « Étymologie » pour récolter de meilleures moissons .
68: Cette rubrique ne comporte pas , dans le NLE , d' indication sur la date de première attestation .
69: Le Littré ne donnait pas de date de première attestation , mais seulement des indications d' usage , par siècle .
70: Une approche diachronique est cependant possible par la requête « Ancienneté » , qui exploite la présence de deux strates rédactionnelles dans le NLE .
71: Elle met en évidence d' une part les mots qui se trouvent dans l' édition de 1874 , mais sont sortis d' usage , et d' autre part ceux qui sont présents dans la nouvelle édition , mais ne l' étaient pas dans celle de 1874 .
72: Le NLE permet par exemple de lister 11 interjections sorties d' usage , de ahi à tarare , en passant par diablezot et morguienne .
73: Menée à plus grande échelle , la requête par « Ancienneté » met à jour deux états synchroniques du lexique , celui de 1874 et celui de 2004 / 2006 , tel que Littré , puis les rédacteurs du NLE les ont perçus .
74: Le PRE :
75: requêtes par « Langue d' origine » , par « Date » , par « Mots de l' étymologie » Les concepteurs du PRE ont été , concernant les dates de première attestation , moins circonspects que ceux du TLFi :
76: ils tirent parti , dès à présent , des informations contenues dans la rubrique « Étymologie » du PRE .
77: Ont été balisées non seulement la langue empruntée , mais aussi la date de première attestation ;
78: une recherche par intervalle entre deux dates a été rendue possible , ainsi qu' une recherche en plein texte limitée à la rubrique « Étymologie » .
79: Ce dernier type de requête permet d' extraire du dictionnaire l' ensemble des mots issus du même étymon .
80: Quelques interrogations par des métatermes , comme sigle , sont également possibles .
81: Ainsi , une requête par « Mots de l' étymologie » avec le mot sigle fournit une liste des 145 articles ;
82: en retranchant siglé et siglaison , dont l' étymologie mentionne sigle en tant qu' étymon et non en tant que descripteur , on obtient la liste des 143 sigles retenus comme entrées par le PRE .
83: Les requêtes par « Mots de l' étymologie » se révèlent cependant décevantes à cause de l' absence de systématicité dans l' emploi des métatermes :
84: si un effort a été fait pour sigle , acronyme et mot-valise , on constatera que suffixe , préfixe , composé , nom propre , attraction , ou encore métathèse , ne sont utilisés que de façon épisodique ;
85: suffixe par exemple ne semble employé que dans les étymologies non triviales .
86: Ainsi lira -t-on dans l' étymologie de chauffard :
87: « 1897 ;
88: de chauff ( eur ) et suffixe péj .
89: - ard » , mais dans celle de chauffeur seulement :
90: « 1680 ;
91: de chauffer » .
92: Une plus grande systématicité dans l' emploi des métatermes donnerait évidemment plus de valeur aux listes constituées à partir de ce type de requête .
93: À l' heure actuelle , c' est donc seulement sur la langue d' origine que l' on peut mener l' enquête à la fois dans le TLFi , le NLE et le PRE , pour procéder à une analyse comparative des résultats .
94: Requête par la langue empruntée
95: On utilisera ici la comparaison des résultats pour mettre en évidence les problèmes certes informatiques , mais aussi linguistiques , qui fragilisent la fiabilité des requêtes par langue empruntée .
96: Un balisage à harmoniser
97: Le balisage de la langue empruntée présente , dans les trois dictionnaires contemporains , des anomalies .
98: Par exemple , le mot mah-jong , pourtant signalé dans le TLFi et le NLE comme « mot chinois » dans la rubrique « Étymologie » de l' article qui lui est consacré , n' est trouvé ni dans le TLFi , par la requête « chinois » dans le type d' objet « Langue empruntée » , ni , dans le NLE , par la requête « Étymologie = chinois » :
99: les listes des résultats doivent être complétées par une fastidieuse recherche en plein texte .
100: Dans le TLFi , le repérage de la langue-cible n' est pas toujours des plus aisés :
101: ainsi pour trouver les mots issus de l' ancien scandinave , il ne convient pas de saisir « ancien scandinave » , ni « norrois » , ni « ancien nordique » , mais « a .
102: nord. » .
103: Balisage et identification des emprunts
104: Dans le PRE , le balisage des emprunts a été systématiquement revu .
105: Toutefois , la mention de l' origine étrangère pour les locutions calquées , introduit dans les listes obtenues des mots que l' on peut percevoir comme des intrus .
106: Apparaissent par exemple dans la liste des emprunts au chinois :
107: face , parce que perdre la face serait un calque d' une locution chinoise , révolution à cause de révolution culturelle , triade à cause de l' emploi du mot au sens de « organisation secrète chinoise de type mafieux » .
108: Ce n' est pas ici la réalisation technique du balisage qu' il faut incriminer , mais son manque de finesse :
109: en l' état actuel , il ne permet pas de distinguer les emprunts des calques , et renvoie aux contours donnés à la définition linguistique de l' emprunt ( Tournier , 1985 ; Sablayrolles , 2000 ; Jacquet-Pfau , 2003 ) .
110: Ces quelques imperfections des requêtes par langue empruntée étant prises en compte , expérimentons la recherche par langue empruntée sur un exemple :
111: les emprunts au russe .
112: Dans le TLFi , la requête par le Type d' objet « Langue empruntée » et l' objet :
113: « Russe » ne fournit que 46 résultats .
114: Elle doit être complétée par une recherche en plein texte , par le Type d' objet « Paragraphe » et l' objet « Russe » .
115: Dans le NLE , la requête « Étymologie = Russe » ramène 47 résultats ;
116: elle doit de même être complétée par la requête « Mot du texte = russe » .
117: Dans le PRE en revanche , la requête étymologique choisissant pour critère la langue russe ramène 96 résultats , dont quelques-uns , comme personnalité ou perspective , surprennent .
118: Personnalité figure en fait dans la liste seulement parce que le PRE signale que la collocation culte de la personnalité est une adaptation du russe ;
119: et perspective est présent à cause de l' emploi de perspective au sens de « grande avenue rectiligne » , qui est la traduction d' un mot russe .
120: Ces mots seraient à prendre en considération dans une étude sur les calques , mais , comme les deux autres dictionnaires ne les ont pas intégrés , il est préférable dans cette étude de les laisser de côté .
121: Les trois dictionnaires fournissent , après corrections , une liste d' environ 80 mots .
122: Si les trois ensembles comportent une intersection , chacun présente un sous-ensemble spécifique :
123: comment expliquer ces différences ?
124: La documentation
125: Une particularité bien connue du TLFi tient à sa documentation d' orientation principalement littéraire .
126: Elle explique notamment la présence des emprunts introduits au 19e siècle par la vogue des romans russes traduits en français :
127: pour cette période , les rédacteurs du TLFi ont , contrairement à ceux du NLE et du PRE , choisi de retenir les mots :
128: tcherkesse attesté dans Frantext chez Alain Fournier et Romain Gary , barine ( Gaston Leroux , Paul Bourget , Camus ) , sotnia ( Leroux , Kessel ) et nagaïka ( Kessel , Cavanna ) .
129: La documentation de Littré était , elle aussi , à dominante littéraire .
130: Le NLE , comme le TLFi , et contrairement au PRE , retient kirghiz , introduit en français par la traduction d' un roman de Pouchkine .
131: Il est le seul à mentionner byline ,
132: « épopée populaire russe » .
133: La documentation du TLFi diffère de celle du NLE et du PRE par sa date .
134: Le dernier russisme enregistré par le TLFi est samizdat ( 1971 ) ;
135: le PRE et le NLE ont pu ajouter cinq emprunts postérieurs :
136: tokamak , nomenklatura , refuznik , glasnost , perestroïka .
137: La postériorité de publication n' explique cependant pas tout .
138: Enregistré par le PRE et le NLE , le mot goulag , par sa date de première attestation , 1938 , aurait semblé susceptible de constituer une entrée du TLFi ;
139: il ne figure pourtant pas dans la nomenclature .
140: C' est sans doute ici l' usage qui a guidé les rédacteurs du TLF .
141: Jusqu'en 1981 en effet , goulag n' est mentionné dans Frantext qu' en citation du titre de l' ouvrage de Soljenitsyne :
142: il n' a pas encore acquis le statut de nom commun autonome , ce qui justifie l' abstention des rédacteurs du TLF .
143: Dans un autre domaine , on pourrait de même s' étonner que le TLFi , contrairement au PRE et au NLE , ne comporte pas d' entrée datcha ( 1843 ) , ni blini ( 1883 ) :
144: là encore , l' usage au moment de la publication du dictionnaire peut expliquer ces choix ;
145: les modes immobilières et alimentaires ont déterminé l' enregistrement de ces emprunts dont la première attestation est ancienne , mais l' entrée dans l' usage plus récente .
146: Le traitement des ethnonymes
147: Le TLFi et le NLE se montrent plus accueillants à l' égard des ethnonymes que le PRE :
148: ils enregistrent tchérémisse , peuple d' origine finnoise et kirghiz , peuple nomade d' Asie centrale ;
149: le TLFi retient en outre :
150: ossète , peuple indo-européen du Caucase central , et tcherkesse , peuple du nord-ouest du Caucase .
151: Alain Rey et Josette Rey-Debove justifient la mise à l' écart des ethnonymes de la façon suivante :
152: Les noms propres de personne ( anthroponymes ) ou de lieux ( toponymes ) produisent de nombreux dérivés , adjectifs ou noms ordinaires .
153: Ces mots sont embarrassants pour le lexicographe dans la mesure où les noms propres sont internationaux et donc translinguistiques .
154: Ce n' est qu' une question d' usage , rien n' empêche de produire des adjectifs français à partir de tous les noms allemands ou arabes d' une encyclopédie , par exemple .
155: D' autre part la plupart de ces dérivés n' ont pas véritablement de sens linguistique :
156: ils désignent par leur radical et signifient seulement par leur suffixe . ( Rey , Rey-Debove , 1993 : 13 )
157: Deux arguments sont avancés :
158: premièrement , la production des ethnonymes est virtuellement non limitée aux lexèmes effectivement attestés ,
159: « ce n' est qu' une question d' usage » ;
160: deuxièmement , ces dérivés n' ont pas « véritablement de sens » car « leur radical » , c' est-à-dire le nom propre ,
161: « désigne » , et ne signifie pas .
162: Ces deux arguments peuvent être contestés .
163: On peut s' étonner de voir balayée d' un revers de main la question de l' usage dans un dictionnaire de langue :
164: le TLFi et le NLE ont préféré mentionner , non pas tous les ethnonymes virtuellement possibles , mais ceux dont l' emploi est attesté .
165: Le second argument repose sur une conception classique du nom propre , développée par Stuart Mill et reprise par Kripke :
166: cette conception , selon laquelle le nom propre serait dépourvu de sens , est aujourd'hui mise en débat ( Siblot , 1995 ; Leroy , 2004 ) .
167: Le TLFi et le NLE manifestent une plus grande ouverture à ce que Paul Siblot appelle la « signifiance » des noms propres :
168: ce choix linguistique les amène à inclure dans leur nomenclature non seulement les ethnonymes cités ci-dessus , mais aussi des mots à référent unique comme kremlin , pour lequel le TLFi donne la définition :
169: « Résidence des tsars à Moscou » , tandis que le PRE l' écarte .
170: La description de l' emprunt
171: La réflexion linguistique sur l' emprunt a souffert , dans la perspective synchronique longtemps privilégiée par la linguistique , d' un certain désintérêt ;
172: pour Saussure en effet ,
173: « le mot emprunté ne compte plus comme tel , dès qu' il est étudié au sein du système » ( Saussure , 1915 : 42 ) .
174: On perçoit dans la présentation lexicographique des emprunts une hésitation entre description diachronique et synchronique .
175: Les russismes à étymon latin
176: Se voulant outil de transmission d' un patrimoine historique , les trois dictionnaires choisissent en principe une description diachronique ;
177: pourtant , des flottements apparaissent dans la description des emprunts dont la morphologie est accessible en synchronie .
178: Pour le TLFi , décembriste et planifier sont des russismes , alors que le PRE y voit des dérivés de décembre et de planifier ;
179: inversement , pour le PRE , défaitisme et vernalisation sont des russismes , tandis que , pour le TLFi , il s' agit de dérivés de défaite et de vernal .
180: Selon le NLE , aucun de ces mots ne serait emprunté au russe .
181: Tous , de fait , sont formés sur des étymons latins :
182: même si ce sont des locuteurs russes qui ont créé le dérivé , le rédacteur a pu être tenté de négliger une étymologie quelque peu contre-intuitive .
183: L' intérêt récent des linguistes pour la notion d' événement linguistique ( Guilhaumou , 2006 ) amènera peut-être à ne pas sous-estimer l' importance de l' acte de création , et à trancher plus nettement en faveur d' une description diachronique .
184: Les mots-voyageurs
185: Une hésitation de même nature apparaît dans la description des mots-voyageurs .
186: Pour le TLFi , cosaque et polatouche sont des emprunts au polonais , qui les emprunte lui-même au russe ;
187: le PRE signale leur origine russe , sans mentionner leur passage par le polonais .
188: Inversement , le PRE ne mentionne pour tsarine que l' emprunt à l' allemand , tandis que le TLFi n' indique que l' origine russe .
189: Il est évidemment un peu surprenant de voir le mot tsarine décrit comme un emprunt à l' allemand , mais si l' on veut serrer au plus près les étapes du transfert lexical , il importe de connaître la langue de transmission .
190: La comparaison des listes fournies par les trois dictionnaires informatisés révèle donc une double instabilité .
191: La première est inhérente à la nature de l' outil de recherche :
192: le dictionnaire ne donne pas un recensement exhaustif des emprunts qu' a pu faire , au cours de son histoire , le français , mais retient seulement ceux qu' il juge utiles à l' usager contemporain :
193: de là , par exemple , la présence de datcha et blini dans le PRE et le NLE , mais pas dans le TLFi .
194: Une seconde instabilité est due à des incertitudes dans l' analyse linguistique :
195: les ethnonymes ont -ils leur place dans un dictionnaire de langue ?
196: Les mots-voyageurs doivent -ils être présentés comme des emprunts à la langue qui les a créés ou à la langue qui les a transmis ?
197: Si le dictionnaire tranche clairement en faveur d' une lexicologie diachronique , il devra tenir indiquer les différentes étapes du parcours et articuler le balisage des langues à celui des dates de première attestation .
198: Requête par date de première attestation
199: La contribution la plus évidente du dictionnaire à la connaissance de l' histoire du lexique est la datation de la première attestation d' une forme lexicale ou de ses changements de sens .
200: La requête par date de première attestation n' est actuellement possible que dans le PRE .
201: Quelle date choisir ?
202: Si , généralement , la rubrique « Étymologie » indique une seule date de première attestation , il est deux situations où elle en mentionne deux , voire davantage .
203: Lorsque la forme graphique du mot a évolué , le PRE donne la date de la forme stabilisée en français moderne , et indique la date de première attestation de la graphie initiale :
204: par exemple , pour kopeck , il donne comme date de première attestation :
205: 1806 , et signale :
206: « copec ;
207: 1607 » .
208: Une autre situation de pluri-datation se présente lorsqu' il y a décalage entre la première attestation du mot et son entrée dans l' usage .
209: Ainsi , pour aristocrate , le PRE donne :
210: « 1550 ;
211: répandu en 1778 » et , avec une autre présentation , pour patriotique :
212: « 1750 ;
213: hapax 1532 » .
214: Or les deux datations ont été balisées :
215: ainsi , aristocrate et patriotique seront ramenés à la fois par une requête sur le 16e siècle , et par une requête sur le 18e ;
216: de même , kopeck apparaîtra à la fois dans les listes du 17e et du 19e siècle .
217: Dès lors , une hiérarchisation dans le balisage des dates semble souhaitable ;
218: elle suppose qu' ait été menée en amont une réflexion linguistique sur ce qu' il convient de considérer comme l' entrée du mot dans la langue .
219: Dans une perspective d' histoire du lexique , le développement de la notion d' événement linguistique , avec la dimension sociale et institutionnelle qu' il comporte , semble devoir conduire à privilégier la date où le mot est « répandu » dans l' usage , donc à préférer pour aristocrate et patriote la seconde date .
220: En revanche kopeck peut très bien avoir été répandu dans l' usage avec une graphie variable , et la première datation peut sembler plus pertinente .
221: La réponse du lexicographe à la question de la datation requiert à la fois une réflexion théorique sur la constitution de la norme lexicale , et un travail d' analyse de discours sur l' archive .
222: Un exemple d' exploitation
223: Dans l' état actuel de son élaboration , le PRE fournit dès à présent un outil utile à l' historien du lexique , et permet de mener des investigations d' une amplitude qu' il lui aurait été difficile d' atteindre sans le secours du dictionnaire informatisé .
224: Pour en donner une illustration , procédons à une recherche comparée des emprunts du français au néerlandais et à l' allemand du 16e au 20e siècle .
225: Approche quantitative
226: Une interrogation par période de 50 ans permet d' évaluer rapidement l' évolution de ces emprunts .
227: Le travail le plus long réside dans la correction des réponses contestables , nécessaire à cause des hésitations que nous avons notées plus haut :
228: enregistrement des calques , comme surhomme ( 1892 ) , pour traduire Ûbermensch , enregistrement de la langue d' origine alors que ce n' est pas la langue par laquelle le mot est entré en français :
229: par exemple , commodore apparaît dans les résultats de la requête des mots issus du néerlandais au 18e siècle , alors qu' il s' agit d' un emprunt certes du 18e siècle , mais à l' anglais ( qui l' avait emprunté au néerlandais ) ;
230: double enregistrement des mots dont la graphie a évolué , comme asticoter , qui figure à la fois dans les résultats du 18e et du 17e siècle , parce que la rubrique étymologie signale la graphie dasticoter , attestée dès 1642 ;
231: double enregistrement des mots dont la date de première attestation est décalée par rapport à la date d' entrée dans l' usage , comme L.S.D. , sigle formé en allemand à partir du mot Lysergsäurediäthylamid , attesté dès 1948 , mais répandu seulement en 1966 .
232: Après ces corrections , on obtient les résultats suivants :
233: Tableau 1
234: La grande époque des emprunts au néerlandais correspond au « siècle d' or » des Pays-Bas .
235: En 1681 , l' Acte de La Haye proclame l' indépendance des Provinces unies , qui se libèrent du joug espagnol .
236: Les Hollandais développent leur puissance maritime et disputent , souvent avec succès , aux Espagnols et aux Portugais leurs possessions coloniales .
237: Le pays est prospère et ouvert aux réfugiés politiques ou religieux .
238: Les emprunts à l' allemand se situent , pendant la période du 16e au 18e siècle , à un niveau comparable à ceux du néerlandais .
239: C' est à partir du début du 19e siècle qu' ils franchissent un seuil quantitatif .
240: Du 19e siècle jusqu'au début du 20e siècle , au moment du plus grand rayonnement scientifique et philosophique de l' Allemagne , les emprunts à l' allemand restent à un niveau élevé , et amorcent leur déclin dans le première moitié du 20e siècle .
241: L' âge pré-industriel :
242: la mer et la terre
243: Les listes obtenues permettent de préciser la nature des emprunts .
244: Sur la période 16e - 18e siècle , emprunts au néerlandais et emprunts à l' allemand s' opposent nettement par leur domaine :
245: alors que les premiers sont liés à la puissance maritime des Provinces unies , les seconds ressortissent du vocabulaire de la mine .
246: Les emprunts au néerlandais manifestent en effet de deux manières le rayonnement des Provinces unies sur les mers :
247: d' une part , ils relèvent du vocabulaire spécialisé de la mer :
248: dès le 16e , on importe des noms de poisson ( flétan , églefin ) ;
249: puis au 17e siècle , ce sont plutôt des mots qui nomment les parties du bateau ( foc , rouf ) , le néerlandais , d' autre part , sert d' intermédiaire entre le français et les mots venus des comptoirs :
250: comme thé , venu du chinois ( ou du malais ) , et palissandre venu d' un créole de Guyane .
251: De la même manière , il sert d' intermédiaire pour diffuser les dénominations portugaises de relias lointaines , comme dans le cas de sargasse , ou de pamplemousse .
252: À la même époque , c' est pour nommer les ressources de la terre que le français recourt à l' allemand , avec cobalt , gangue au 16e , castine , zinc , bismuth au 17e , quartz , blende , hornblende , pechblende , spath , feldspath , mispickel , gneiss au 18e .
253: L' exploitation des ressources minières des montagnes hercyniennes , de part et d' autre de la forêt noire , s' est inspirée du modèle allemand .
254: Comme le néerlandais , l' allemand peut être une langue de transmission .
255: Le facteur historique déterminant n' est pas alors la puissance maritime , mais la guerre :
256: les transferts lexicaux sont passés par les mercenaires allemands , qui servent sous le commandement français depuis le 15e siècle , auxquels ce sont ajoutés , après leur défaite à Marignan , les Suisses .
257: Sont ainsi empruntés à l' allemand :
258: obus ( du tchèque haufnice ) , sabre et hussard ( du hongrois szablya et huszar , « le vingtième » , parce qu' en 1458 le gouvernement hongrois ordonna la levée d' un homme sur huit pour former une cavalerie ) , uhlan ( du polonais oglan ) .
259: La langue populaire , du 16e au 20e siècle
260: Matelots et soldats , mais aussi main d' oeuvre en quête de travail , ont au fil des siècles laissé des traces dans la langue populaire .
261: Les apports du néerlandais sont quantitativement modestes , mais réguliers :
262: au 16e siècle :
263: ripaille , drôle , au 17e , gribouiller , gredin , micmac , au 18 e , cambuse , bastringue , au 19 e , gribiche ( « mégère » ) , vaser ( « pleuvoir » ) , au 20e , margaille ( « bagarre , désordre » ) .
264: Ceux de l' allemand , plus nombreux , témoignent d' une circulation linguistique constante , particulièrement riche au 19e siècle , lorsque , de part et d' autre du Rhin , la Révolution industrielle jette sur les routes des ouvriers itinérants à la recherche d' embauche .
265: On relève :
266: au 16e siècle :
267: chenapan , brinde ( devenu bringue au 19e siècle ) au 17e , glass ( « verre d' une boisson alcoolisée » ) , nouille , au 18e , asticoter , drille , loustic , schnaps , au 19e , chnouf ( « drogue » ) , turne ( « chambre » ) , estourbir , schlague ( « coup » ) , nase , chlinguer , arpète ( « jeune couturière apprentie » ) , flingue , clamser , schproum ( « dispute violente » ) , mouise .
268: Dans un contexte historique d' affrontement , le 20e siècle multiplie les emprunts servant de dénominations familières et péjoratives des Allemands , avec fritz , fridolin , frisé ;
269: de l' argot des camps restent Kapo , Stalag , Oflag .
270: Les emprunts savants à l' allemand
271: À partir de la fin du 18e siècle , un nouveau type d' emprunt apparaît :
272: les emprunts formés par les savants allemands sur des bases latines ou grecques .
273: Des domaines scientifiques très variés sont concernés ;
274: on en donnera ici seulement quelques illustrations , choisies parmi les emprunts du 19e siècle :
275: la chimie :
276: benzine , émulsine , barbiturique , la médecine :
277: leucémie , embolie , homéopathie , la philosophie :
278: noème , déterminisme , pragmatisme , et , bien sûr , la linguistique :
279: morphologie ( créé par Goethe d' abord pour la botanique ) , orthoépie , stylistique , syntactique , sémasiologie .
280: Certes , du point de vue de la morphologie lexicale , ces mots ne présentent pas de caractère germanique ( Jacquet-Pfau , Moreaux , 1998 ) , mais , du point de vue de l' histoire de la langue , l' interrogation par le dictionnaire informatisé met en évidence un moment de forte influence du discours savant allemand sur le lexique français .
281: Les dictionnaires informatisés facilitent , et donc favorisent une approche historique du lexique français .
282: Adossés à une riche documentation étymologique , ils sont susceptibles de donner à voir sa structuration diachronique .
283: Certes , les balisages actuels , encore timides ou imparfaits , pourront être améliorés ;
284: plus fondamentalement , la représentation de la structure diachronique dessinée par les dictionnaires ne coïncide pas exactement avec sa réalité historique :
285: les dictionnaires ne retiennent dans leur nomenclature que les mots qu' ils jugent pertinents dans le discours contemporains , et , du fait de cette sélection , renvoient de l' histoire du lexique une image déformée .
286: Mais cette image elle-même , variable d' un dictionnaire à l' autre , évolutive , constitue la trace mémorielle active du passé linguistique ( Paveau , 2006 ) et fait elle-même partie de la description du français .
287: Aux diachroniciens de comparer les images successives données par les dictionnaires , et de confronter ces représentations à l' histoire du lexique telle qu' ils peuvent la reconstituer , notamment grâce à l' informatisation des dictionnaires anciens .
288: Forte d' une tradition lexicographique exceptionnelle ( Pruvost , 2000 : 9 - 11 ) , la linguistique française a aujourd'hui , avec les dictionnaires informatisés , l' opportunité de développer un secteur des sciences du langage longtemps relégué au second plan par le primat d' un structuralisme synchroniste .
289: Références bibliographiques
290: Blum ,
291: C . , Pruvost , J. ( 2007 ) .
292: Le Nouveau Littré .
293: Version électronique .
294: Paris :
295: Éditions Garnier .
296: Bouverot ,
297: D . , Steuckardt ,
298: A . ( à paraître en 2008 ) .
299: À travers le TLFi :
300: les emprunts au russe .
301: Neologica , n° 2 .
302: Caron , P. , Dajenais , L. , Gonfroy , G. ( 1992 ) .
303: Le programme d' informatisation du Dictionnaire critique de la langue française de l' abbé Féraud ( 1787 ) .
304: In Wooldridge ,
305: T.R . ( éd. ) , Historical Dictionary Databases .
306: Édition en ligne :
307: Computing in the Humanities Working Papers , 1996 ( http ) .
308: Dendien , J. ( Conception et réalisation informatiques ) ( 2002 ) .
309: Le Trésor de la Langue française informatisé .
310: Version informatique du TLF ( 1971 - 1994 ) .
311: ATILF et CNRS Éditions .
312: Guilhaumou , J. ( 2006 ) .
313: Discours et événement .
314: L' histoire langagière des concepts .
315: Besançon :
316: Presses Universitaires de Franche Comté .
317: Humbley , J. ( 1986 ) .
318: Les anglicismes dans le Dictionnaire critique et dans le Supplément .
319: Autour de Féraud .
320: La lexicographie en France de 1762 à 1835 .
321: Paris :
322: École Normale Supérieure de Jeunes Filles , 147 - 155 .
323: Jacquet-Pfau ,
324: C . , Moreaux , M .
325: - A . ( 1998 ) .
326: Motivation et transparence des emprunts gréco-latins en français et en allemand .
327: In Clas ,
328: A . , Mejri , S. , Baccouche , T. ( éds ) , La mémoire des mots , Tunis :
329: AUPELF-UREF et Serviced , 587 - 600 .
330: Jacquet-Pfau C. ( 2003 ) .
331: Du statut de l' emprunt en traitement automatique des langues .
332: In Sablayrolles , J .
333: - F . ( éd. ) , L' innovation lexicale .
334: Paris :
335: Honoré Champion ,
336: 79 - 97 .
337: Leroy , S. ( 2004 ) .
338: De l' identification à la catégorisation .
339: L' antonomase du nom propre en français .
340: Louvain-Paris :
341: Éditions Peeters .
342: Martin , R. ( 2001 ) .
343: Sémantique et automate :
344: l' apport du dictionnaire informatisé , Paris :
345: Presses Universitaires de France .
346: Paveau , M .
347: - A . ( 2006 ) .
348: Les prédiscours .
349: Sens , mémoire , cognition , Paris :
350: Presses de la Sorbonne Nouvelle .
351: Pierrel , J .
352: - M . ( 2003 ) .
353: Un ensemble de ressources de référence pour l' étude du français :
354: TLFi , Frantext et le logiciel Stella .
355: Revue québecoise de linguistique , volume 32 , n° 1 , 155 - 176 .
356: Pruvost , J. ( 2000 ) .
357: Dictionnaires et nouvelles technologies .
358: Paris :
359: Presses Universitaires de France .
360: Rey ,
361: A . , Rey-Debove , J. ( 1993 ) .
362: Préface du Nouveau Petit Robert .
363: Paris :
364: Le Robert ,
365: 9 - 23 .
366: Rey ,
367: A . , Rey-Debove , J. ( dir. ) ( 2006 ) .
368: Le Nouveau Petit Robert 2007 .
369: CD-ROM .
370: Nouvelle édition du Petit Robert de Paul Robert , remaniée .
371: Le Robert Éditions électroniques .
372: Saussure ,
373: F . ( 1916 ) .
374: Cours de linguistique générale , Paris :
375: Payot .
376: Sablayrolles J .
377: - F . ( 2000 ) , La néologie en français contemporain , Paris :
378: Honoré Champion .
379: Siblot , P. ( 1995 ) .
380: Noms propres et image de marque .
381: De la construction du sens dans les noms propres .
382: In Noailly , M. ( éd. ) , Nom propre et nomination .
383: Paris :
384: Klincksieck , 147 - 186 .
385: Steinfeld , N. , Petrequin , G. , Evrard ,
386: A . ( 2005 ) .
387: Projet TLF-Étym :
388: mise à jour des notices étymologiques du Trésor de la langue française informatisé .
389: Dossier de présentation , Nancy :
390: Laboratoire ATILF .
391: Steuckardt ,
392: A . ( 2008 ) .
393: Les emprunts aux langues germaniques :
394: parcours diachronique .
395: Site web du Cercle des Linguistes d' Aix-en-Provence .
396: http
397: Tournier , J. ( 1985 ) .
398: Introduction descriptive à la lexicogénétique de l' anglais contemporain .
399: Paris :
400: Honoré Champion .
401: Wionet ,
402: C . , Tutin ,
403: A . ( 2001 ) .
404: Pour informatiser le dictionnaire de Basnage 1702 et de Trévoux 1704 , Paris :
405: Honoré Champion .