Théorie motrice de la perception de la parole - Motor theory of speech perception

La théorie motrice de la perception de la parole est l'hypothèse selon laquelle les gens perçoivent les mots prononcés en identifiant les gestes des voies vocales avec lesquels ils sont prononcés plutôt qu'en identifiant les modèles sonores générés par la parole. Il prétendait à l'origine que la perception de la parole se fait par le biais d'un module spécialisé qui est inné et spécifique à l'homme. Bien que l'idée de module ait été nuancée dans des versions plus récentes de la théorie, l'idée demeure que le rôle du système moteur de la parole n'est pas seulement de produire des articulations de la parole mais aussi de les détecter.

L'hypothèse a suscité plus d'intérêt en dehors du domaine de la perception de la parole qu'à l'intérieur. Celle-ci s'est particulièrement accrue depuis la découverte des neurones miroirs qui relient la production et la perception des mouvements moteurs, y compris ceux effectués par le conduit vocal.

La théorie a été initialement proposée dans les laboratoires Haskins dans les années 1950 par Alvin Liberman et Franklin S. Cooper , et développée par Donald Shankweiler , Michael Studdert-Kennedy , Ignatius Mattingly , Carol Fowler et Douglas Whalen .

Origines et développement

Lorsque nous entendons des mots prononcés, nous sentons qu'ils sont faits de sons auditifs . La théorie motrice de la perception de la parole soutient que derrière les sons que nous entendons se trouvent les mouvements intentionnels du conduit vocal qui les prononce .

L'hypothèse a ses origines dans la recherche utilisant la lecture de motifs pour créer des machines de lecture pour les aveugles qui substitueraient des sons aux lettres orthographiques. Cela a conduit à un examen attentif de la façon dont les sons parlés correspondent à leur spectrogramme acoustique en tant que séquence de sons auditifs. Cela a révélé que les consonnes et les voyelles successives se chevauchent dans le temps (un phénomène connu sous le nom de coarticulation ). Cela suggère que la parole n'est pas entendue comme un "alphabet" ou un "chiffre" acoustique, mais comme un "code" de gestes vocaux qui se chevauchent.

Approche associationniste

Initialement, la théorie était associationniste : les nourrissons imitent la parole qu'ils entendent et que cela conduit à des associations comportementales entre l'articulation et ses conséquences sensorielles. Plus tard, ce mimétisme manifeste serait court-circuité et deviendrait perception de la parole. Cet aspect de la théorie a été abandonné, cependant, avec la découverte que les nourrissons prélinguistiques pouvaient déjà détecter la plupart des contrastes phonétiques utilisés pour séparer les différents sons de la parole.

Approche cognitiviste

L'approche comportementale a été remplacée par une approche cognitiviste dans laquelle il y avait un module de parole . Le module a détecté la parole en termes d' objets distaux cachés plutôt qu'au niveau proximal ou immédiat de leur entrée. La preuve en était la recherche qui a révélé que le traitement de la parole était spécial, comme la perception duplex .

Changement d'objets distaux

Initialement, la perception de la parole était supposée être liée à des objets de la parole qui étaient à la fois

  • les mouvements invariants des articulateurs de la parole
  • les commandes motrices invariantes envoyées aux muscles pour déplacer les articulateurs des voies vocales

Cela a ensuite été révisé pour inclure les gestes phonétiques plutôt que les commandes motrices, puis les gestes voulus par le locuteur à un niveau linguistique prévocal, plutôt que les mouvements réels.

Révision moderne

L'allégation « la parole est spéciale » a été abandonnée, car il a été constaté que la perception de la parole pouvait se produire pour des sons non vocaux (par exemple, des portes qui claquent pour une perception duplex ).

Neurones miroirs

La découverte des neurones miroirs a suscité un regain d'intérêt pour la théorie motrice de la perception de la parole, et la théorie a toujours ses partisans, bien qu'il y ait aussi des critiques.

Soutien

Informations sur les gestes non auditifs

Si la parole est identifiée en fonction de la manière dont elle est physiquement produite, alors les informations non auditives devraient être incorporées dans les perceptions de la parole même si elles sont encore subjectivement entendues en tant que "sons". C'est effectivement le cas.

  • L' effet McGurk montre que voir la production d'une syllabe parlée qui diffère d'un signal auditif synchronisé avec elle affecte la perception de la syllabe auditive. En d'autres termes, si quelqu'un entend « ba ​​» mais voit une vidéo de quelqu'un prononçant « ga », ce qu'il entend est différent — certaines personnes croient entendre « da ».
  • Les gens ont plus de facilité à entendre la parole dans le bruit s'ils peuvent voir l'orateur.
  • Les gens peuvent mieux entendre les syllabes lorsque leur production peut être ressentie de manière haptique .

Perception catégorielle

À l'aide d'un synthétiseur vocal , les sons de la parole peuvent être modifiés à la place de l'articulation le long d'un continuum de /bɑ/ à /dɑ/ à /ɡɑ/ , ou dans le temps d'apparition de la voix sur un continuum de /dɑ/ à /tɑ/ (par exemple) . Lorsqu'on demande aux auditeurs de discriminer entre deux sons différents, ils perçoivent les sons comme appartenant à des catégories distinctes, même si les sons varient continuellement. En d'autres termes, 10 sons (le son d'un extrême étant /dɑ/ et le son de l'autre extrême étant /tɑ/ , et ceux du milieu variant sur une échelle) peuvent tous être acoustiquement différents les uns des autres, mais l'auditeur les entendra tous sous la forme /dɑ/ ou /tɑ/ . De même, la consonne anglaise /d/ peut varier dans ses détails acoustiques dans différents contextes phonétiques (le /d/ dans /du/ ne sonne pas techniquement le même que celui dans /di/ , par exemple), mais tous les /d/ 's tels que perçus par un auditeur entrent dans une catégorie (plosive alvéolaire vocale) et c'est parce que "les représentations linguistiques sont des segments abstraits, canoniques, phonétiques ou les gestes qui sous-tendent ces segments". Cela suggère que les humains identifient la parole en utilisant la perception catégorielle , et donc qu'un module spécialisé, tel que celui proposé par la théorie motrice de la perception de la parole, pourrait être sur la bonne voie.

Imitation de la parole

Si les gens peuvent entendre les gestes dans la parole, alors l'imitation de la parole devrait être très rapide, comme lorsque des mots sont répétés qui sont entendus dans des écouteurs comme dans l'ombrage de la parole . Les gens peuvent répéter les syllabes entendues plus rapidement qu'ils ne seraient capables de les produire normalement.

Production de discours

  • Entendre la parole active les muscles des voies vocales, ainsi que le cortex moteur et le cortex prémoteur . L'intégration des entrées auditives et visuelles dans la perception de la parole implique également de tels domaines.
  • Perturber le cortex prémoteur perturbe la perception des unités de la parole telles que les plosives .
  • L'activation des aires motrices se produit en termes de caractéristiques phonémiques qui se lient aux articulateurs de la piste vocale qui créent les gestes de la parole.
  • La perception d'un son de parole est facilitée en stimulant de manière préemptive la représentation motrice des articulateurs responsables de sa prononciation.
  • Le couplage cortical auditif et moteur est limité à une plage spécifique de fréquence de décharge neuronale.

Maillage perception-action

Il existe des preuves que la perception et la production sont généralement couplées dans le système moteur. Ceci est soutenu par l'existence de neurones miroirs qui sont activés à la fois en voyant (ou en entendant) une action et lorsque cette action est effectuée. Une autre source de preuve est celle de la théorie du codage commun entre les représentations utilisées pour la perception et l'action.

des reproches

La théorie motrice de la perception de la parole n'est pas largement répandue dans le domaine de la perception de la parole, bien qu'elle soit plus populaire dans d'autres domaines, tels que la linguistique théorique . Comme l'ont noté trois de ses défenseurs, « il a peu de partisans dans le domaine de la perception de la parole, et de nombreux auteurs le citent principalement pour offrir un commentaire critique ». p. 361 Il existe plusieurs critiques à son égard.

Plusieurs sources

La perception de la parole est affectée par des sources d'information non productives, telles que le contexte. Les mots individuels sont difficiles à comprendre isolément mais faciles lorsqu'ils sont entendus dans le contexte de la phrase. Il semble donc que la perception de la parole utilise des sources multiples qui s'intègrent entre elles de façon optimale.

Production

La théorie motrice de la perception de la parole prédirait que les capacités motrices de la parole chez les nourrissons prédisent leurs capacités de perception de la parole, mais en réalité c'est l'inverse. Cela prédirait également que des défauts dans la production de la parole altéreraient la perception de la parole, mais ce n'est pas le cas. Cependant, cela n'affecte que la première version comportementaliste de la théorie, déjà dépassée, où les nourrissons étaient censés apprendre tous les modèles de perception de la production par imitation dès le début de l'enfance. Ce n'est plus l'opinion dominante des théoriciens de la parole motrice.

Module de parole

Plusieurs sources de preuves d'un module vocal spécialisé n'ont pas été prises en charge.

  • La perception duplex peut être observée avec les claquements de porte.
  • L' effet McGurk peut également être obtenu avec des stimuli non linguistiques, tels que montrer à quelqu'un une vidéo d'un ballon de basket rebondissant mais jouant le son d'une balle de ping-pong rebondissant.
  • En ce qui concerne la perception catégorielle , les auditeurs peuvent être sensibles aux différences acoustiques au sein d'une seule catégorie phonétique.

En conséquence, cette partie de la théorie a été abandonnée par certains chercheurs.

Tâches sublexicales

Les preuves fournies pour la théorie motrice de la perception de la parole se limitent à des tâches telles que la discrimination de syllabes qui utilisent des unités de discours et non des mots ou des phrases parlées complets. En conséquence, « la perception de la parole est parfois interprétée comme se référant à la perception de la parole au niveau sublexical. Cependant, le but ultime de ces études est vraisemblablement de comprendre les processus neuronaux soutenant la capacité de traiter les sons de la parole dans des conditions écologiquement valables, qui c'est-à-dire des situations dans lesquelles un traitement réussi du son de la parole conduit finalement à un contact avec le lexique mental et la compréhension auditive." Cela pose cependant le problème d'une « connexion ténue avec leur cible implicite d'investigation, la reconnaissance de la parole ».

Des oiseaux

Il a été suggéré que les oiseaux entendent également le chant des oiseaux des autres en termes de gestes vocaux.

Voir également

Les références

Liens externes