« Du sens au son », en d’autres termes comment s’élaborent les différentes étapes de la production du langage oral dans le cerveau-esprit humain? Les explications nous sont données par le professeur Jean-Luc Nespoulous dans une vidéo dont le texte est reproduit ci-dessous.
La quasi-totalité des modèles psycholinguistiques de la production du langage oral, lors de la transmutation du sens en sons postulent l’existence de différents niveaux de représentation reliés entre eux, de manière séquentielle, par divers types de processus.
Merrill Garrett, au début des années 80 du siècle précédent, considère ainsi que cinq niveaux de représentation et cinq types de processus doivent, au minimum, être mobilisés dans le cerveau/esprit humain lors de la programmation et la production de l’unité minimale de communication qu’est la phrase :
Les processus inférentiels
Au commencement de tout acte de parole , il faut bien postuler l’existence de processus cognitifs qui sortent le cerveau/esprit humain du repos relatif dans lequel il se trouvait pour mobiliser l’architecture fonctionnelle du langage afin de satisfaire tel ou tel besoin d’interaction avec autrui. C’est là, en quelque sorte, le « coup d’envoi » de l’acte de parole, lequel correspond à l’ « intentionnalité » de celui qui s’apprête à prendre la parole. Ces premiers processus, que Garrett qualifie d’ « inférentiels » permettent l’édification de la « représentation du message » : ce pour quoi on va prendre la parole.
Comme dans tous les modèles psycholinguistiques de la production du langage, la nature d’un tel niveau de représentation – très en amont dans la genèse du comportement verbal – et celle des processus qui s’y trouvent impliqués est relativement vague. Il n’en demeure pas moins que ce niveau existe, selon Garrett, et qu’il va servir de « garde-fou » tout au long de la construction du message à produire. Ainsi, toute inadéquation entre cette « intention sémiotique initiale » et les opérations d’encodage subséquentes débouchera – si le locuteur est suffisamment vigilant – sur une autocorrection venant modifier la formulation finale du message afin de rendre cette dernière conforme à son intentionnalité initiale.
Une fois déterminé le « pourquoi » de la prise de parole à venir, le locuteur entre alors progressivement dans plusieurs étapes successives de mise en forme du message avant la production de ce dernier par les organes de la phonation.
Les processus logiques et syntaxiques
Par une série de processus « logico-sémantiques », cette représentation initiale du message à transmettre va se transformer en une (deuxième) représentation que Garrett qualifie de « fonctionnelle », laquelle – ressemblant à s’y méprendre à une « Grammaire des Cas » à la Fillmore – permet de préciser un peu plus la structure sémantique (d’autres diraient « actantielle ») du message à transmettre. Ainsi, se trouve alors décidé des « arguments » gravitant autour d’un « prédicat » ou, en d’autre termes, des « actants » organisés autour d’un « procès ». … le tout indépendamment de la façon – non encore déterminée à ce stade – dont ces ingrédients logico-sémantiques se trouveront finalement spécifiés en termes tant lexicaux (Pierre, Paul, il …) que syntaxiques : une future phrase active – « Pierre bat Paul » — et une future phrase passive – « Paul est battu par Pierre » — sont encore identiques au niveau de la représentation fonctionnelle.
Les processus en jeu à ce niveau sont au nombre de trois :
1. Edification d’une matrice « actantielle »
2. Première recherche lexicale à base sémantique
3. Insertion de ces représentations lexico-sémantiques dans la patrice actantielle (« mapping »).
Sur la base de cette représentation fonctionnelle, survient alors une nouvelle série de trois processus syntactico-lexico-phonologiques (nous verrons qu’il s’agit, en fait, de deux fois trois processus), processus qui vont engendrer le niveau de représentation suivant : la représentation positionnelle.
1. l’édification d’une matrice syntaxique, matrice qui peut être caractérisée par une « structure syntaxique » à la Chomsky, contenant déjà (a) une arborescence (hiérarchique) et (b) les morphèmes grammaticaux requis MAIS (c) en l’absence des mots lexicaux de classe ouverte … qui va être opérée séparément, voire parallèlement…
2. c’est là le deuxième type de processus mobilisé à ce stade : la sélection, des formes lexicales adéquates (compte tenu des niveaux de représentation précédents : « représentation du message » et « représentation fonctionnelle ». C’est l’étape au cours de laquelle le locuteur, fort des enveloppes sémantiques qu’il a déterminées au niveau précédent, va puiser dans son lexique mental tel ou tel « signifiant » susceptible de traduire au mieux le contenu qu’il souhaite transmettre. La question se pose ici de décider si, dans un récit ayant trait à Napoléon, le locuteur va décider de recourir au nom propre ou à d’autres vocables comme « l’empereur », « le vainqueur d’Austerlitz », « le vaincu de Waterloo », le « despote », le « corse » ou tout simplement « il », si Napoléon a déjà fait l’objet d’une lexicalisation dans une précédente phrase.
Tous ces mots ou syntagmes ont quasiment la même représentation au niveau fonctionnel (lexico-sémantique). Ils ne diffèrent que dans leur « enveloppe formelle » et permettent de maintenir la cohésion et la cohérence d’un discours continu (si l’on accepte, un instant, de dépasser les limites de la phrase) évitant ainsi la simple répétition – à effet litanique – d’un seul et même mot !
3. Comme dans le passage de la représentation du message à la représentation fonctionnelle, intervient alors, l’insertion des formes lexicales choisies dans la matrice syntaxique retenue (le « mapping »).
Ces trois types de processus débouchent sur l’édification de la représentation positionnelle, où la linéarité du message – chère à un de Saussure – apparaît pour la première fois … d’où le nom retenu par Garrett.
Les processus sub-lexicaux
Toujours entre le niveau fonctionnel et positionnel cependant, une deuxième série de trois processus doivent toutefois être pris en considération : processus que Stéphanie Shattuck-Hufnagel, une disciple de Garrett qualifie de « sub-lexicaux ». En bref, il s’agit de processus qui permettent la recomposition phonologique (phonémique) dynamique, en temps réel, des items lexicaux tirés du lexique mental du locuteur sous une première forme phonologique, statique et plus abstraite par définition.
Pourquoi un tel « retraitement » ? Tout simplement, parce que, chez les sujets normaux comme chez les aphasiques sur lesquels nous avons travaillé longuement, des erreurs phonémiques viennent émailler, avec plus ou moins de fréquence, leur discours. Si une erreur comme /balavo/ produit en lieu et place de /lavabo/ est possible – et l’est, de fait – , alors la preuve est faite (i) que le locuteur avait bien trouvé la forme lexico-phonologique abstraite qu’il recherchait, (ii) qu’il a estropié cette forme en la reconstituant, (iii) tout cela avant toute programmation et exécution des gestes articulatoires (phonétiques) engendrant les signaux sonores de la parole. Les lésions cérébrales entraînant l’aphasie montrent bien que les processus phonologiques peuvent être perturbés en l’absence de tout dysfonctionnement phonétique (moteur) et vice versa.
Ces processus sub-lexicaux sont également au nombre de trois :
1. Edification d’une matrice « métrique » correspondant à la structuration syllabique canonique du mot retenu
2. Sélection des divers segments consonantiques et vocaliques nécessaires à l’encodage du dit mot
3. Insertion des segments dans la matrice (« mapping », à nouveau).
Dans l’exemple précédent – du locuteur produisant /balavo/ pour /lavabo/– il est donc clair que les deux premiers processus ont été convenablement mobilisés et que le problème est survenu lors de la phase de « mapping » : les structures syllabiques sont correctes ; les segments activés sont les bons. Seule pose problème l’insertion des phonèmes aux bons endroits !
Ce n’est donc qu’au terme de ces deux fois trois processus que la représentation positionnelle (linéaire) se trouve échafaudée.
Ne pas conclure toutefois de l’exemple ci-dessus que de telles erreurs sub-lexicales n’interviennent qu’au niveau du mot (ou, plus précisément, à l’intérieur des frontières du mot). Bien au contraire, bon nombre d’entre elles franchissent les frontières des mots et donnent ainsi les contrepèteries involontaires si fréquentes dans le comportement verbal du locuteur ordinaire… Elles impliquent alors des phonèmes ayant le plus souvent le même statut phonologique dans les divers mots dans lesquels ils « auraient dû » apparaître, de même qu’ils émanent le plus souvent de mots ayant le même statut lexical catégoriel (nom/nom, adjectif/adjectif…). La représentation phonologique linéaire dont il est question ici porte donc sur le syntagme, voire la phrase à produire, et non sur celle d’items lexicaux isolément considérés.
Les processus de codage moteur
Ayant édifié la représentation positionnelle du message à produire, il ne reste plus au locuteur qu’à mobiliser des traitements plus « périphériques » d’ordre phonétique, articulatoires, coarticulatoires, moteurs… conduisant à la production effective du message par les organes de la phonation.
Remarques critiques au modèle de Garrett
Une telle modélisation, chacun le comprendra aisément, est loin d’être complète et satisfaisante.
Parmi les critiques habituellement adressées à Garrett, on retrouve : son caractère trop hiérarchique et séquentiel, ne faisant aucune place à des boucles rétroactives. P. Levelt comblera partiellement cette lacune, même si son modèle à lui reprend pour l’essentiel l’architecture fonctionnelle du modèle de son prédécesseur.
Autre question : et la prosodie dans tout cette architecture ? De fait, elle est cruellement absente alors qu’il serait aisé, comme nous l’avons souvent fait nous même, de la localiser à différents endroits de l’architecture … à différents endroits dans la mesure où il y a différents types de marqueurs prosodiques :
– de toute évidence, les marqueurs prosodiques de l’intentionnalité du locuteur (ironie, par exemple) ne peut qu’être planifiée dès le début de l’acte d’encodage d’un message (certainement en même temps que certains marqueurs mimo-gestuels de la même ironie),
– de son côté, le choix de marquer une interrogation par voie prosodique et/ou syntaxique ne peut intervenir qu’au moment où est édifiée la matrice syntaxique, un peu plus en aval du niveau précédent dans le même modèle,
– les marqueurs prosodiques « locaux », comme la place de l’accent dans les langues où elle a une fonction distinctive (/tErmino/, en espagnol !), ne peut qu’intervenir au moment où est effectué le choix des formes lexicales,
– même chose pour les marqueurs « tonaux » dans les langues où les tons ont une fonction distinctive (ex : vietnamien)
– quant aux marqueurs à fonction stylistique ou rhétorique (accent emphatique, par exemple), ils sont susceptibles d’intervenir au même moment que s’effectuent certains choix lexicaux, l’emphase pouvant être également marquée par des adverbes comme « énormément », « très », « trop »…
– restent enfin des marqueurs qui nous paraissent plus périphériques et « de bas niveau » comme certains accents initiaux ou finaux en Français. Ayant en, particulier, une fonction démarcative, ils interviendraient plus tard dans le décours temporel de la planification et de l’exécution des programmes moteurs de la parole (mais cela reste à voir. Cf. les travaux récents de Corine Astésano en la matière).
Pour finir sur une note très positive, un tel modèle psycholinguistique – de même que bien d’autres, pour sûr – offrent le grand avantage de localiser tel ou tel dysfonctionnement à tel ou tel niveau dans l’architecture fonctionnelle du langage dans le cerveau/esprit humain. Une telle localisation – dans le modèle (pas nécessairement dans le cerveau !) – est d’une importance capitale pour quiconque souhaite mieux comprendre la nature de tel ou tel dysfonctionnement, et ce afin de pouvoir intervenir sur le dit dysfonctionnement de manière motivée et, on l’espère, efficace.
L’utilisation de tels modèles me semble donc indispensable (i) dans l’étude du développement du langage chez l’enfant, (ii) dans l’étude de l’apprentissage des langues secondes ainsi que (iii) dans le domaine de la pathologie du langage qui a été mon domaine d’étude tout au long de ma carrière.
Note : La totalité des éléments utilisés dans ce document émanent de diverses publications de leur auteur et mentionnent explicitement, le cas échéant, les sources
issues des travaux d’autres auteurs.
Crédit photos Pixabay